Update README.md
Browse files
README.md
CHANGED
@@ -122,32 +122,31 @@ wiki_cate_schema_zh = {
|
|
122 |
|
123 |
| 名称 | 下载 | 数量 | 描述 |
|
124 |
| ------------------- | ---------------------------------------------------------------------------------------------------------------------- | ------ | -------------------------------------------------------------------------------------------------------------------------------------------------------- |
|
125 |
-
| InstructIE
|
126 |
-
| InstructIE-valid | [Google drive](https://drive.google.com/file/d/1EMvqYnnniKCGEYMLoENE1VD6DrcQ1Hhj/view?usp=drive_link) <br/> [HuggingFace](https://huggingface.co/datasets/zjunlp/KnowLM-IE) <br/> [百度云盘](https://pan.baidu.com/s/11u_f_JT30W6B5xmUPC3enw?pwd=71ie) | 2000+ | InstructIE验证集 |
|
127 |
-
| InstructIE-test | [Google drive](https://drive.google.com/file/d/1WdG6_ouS-dBjWUXLuROx03hP-1_QY5n4/view?usp=drive_link) <br/> [HuggingFace](https://huggingface.co/datasets/zjunlp/KnowLM-IE) <br/> [百度云盘](https://pan.baidu.com/s/1JiRiOoyBVOold58zY482TA?pwd=cyr9) | 2000+ | InstructIE测试集 |
|
128 |
-
| train.json, valid.json | [Google drive](https://drive.google.com/file/d/1vfD4xgToVbCrFP2q-SD7iuRT2KWubIv9/view?usp=sharing) | 5000 | [CCKS2023 开放环境下的知识图谱构建与补全评测任务一:指令驱动的自适应知识图谱构建](https://tianchi.aliyun.com/competition/entrance/532080/introduction) 中的初赛训练集及测试集 |
|
129 |
|
130 |
|
131 |
-
|
132 |
-
- `InstructIE-
|
133 |
-
|
134 |
-
- `
|
|
|
|
|
|
|
|
|
135 |
|
136 |
|
137 |
<details>
|
138 |
<summary><b>各字段的说明</b></summary>
|
139 |
|
140 |
|
141 |
-
|
142 |
-
|
|
143 |
-
|
|
144 |
-
|
|
145 |
-
|
|
146 |
-
|
|
147 |
-
|
|
148 |
-
|
|
149 |
-
| entity | 实体(entity, entity_type) |
|
150 |
-
| relation | input中涉及的关系三元组(head, relation, tail) |
|
151 |
|
152 |
</details>
|
153 |
|
|
|
122 |
|
123 |
| 名称 | 下载 | 数量 | 描述 |
|
124 |
| ------------------- | ---------------------------------------------------------------------------------------------------------------------- | ------ | -------------------------------------------------------------------------------------------------------------------------------------------------------- |
|
125 |
+
| InstructIE | [Google drive](https://drive.google.com/file/d/1raf0h98x3GgIhaDyNn1dLle9_HvwD6wT/view?usp=sharing) <br/> [百度云盘](https://pan.baidu.com/s/1-u8bD85H1Otbzk-gjLxaFw?pwd=c1i6) | 20w+ | InstructIE数据集(中英双语) |
|
|
|
|
|
|
|
126 |
|
127 |
|
128 |
+
|
129 |
+
`InstructIE` 数据集包含两个核心文件夹:`InstructIE-zh` 和 `InstructIE-en`。这两个文件夹都涵盖了中英双语的基于主题的IE指令数据。
|
130 |
+
|
131 |
+
- `'id'`:每条数据的唯一标识符,确保数据项的独立性和可追踪性。
|
132 |
+
- `'cate'`:**文本主题**分类,为文本内容提供了一个高级的分类标签(共有12种主题)。
|
133 |
+
- `'text'`:待抽取的文本。
|
134 |
+
- `'relation'`:代表**关系**三元组,这些字段允许用户自由构建信息抽取的指令和预期输出结果。
|
135 |
+
|
136 |
|
137 |
|
138 |
<details>
|
139 |
<summary><b>各字段的说明</b></summary>
|
140 |
|
141 |
|
142 |
+
| 字段 | 说明 |
|
143 |
+
| :---------: | :----------------------------------------------------------: |
|
144 |
+
| id | 每个数据点的唯一标识符。 |
|
145 |
+
| cate | 文本的主题类别,总计12种不同的主题分类。 |
|
146 |
+
| input | 模型的输入文本,目标是从中抽取涉及的所有关系三元组。 |
|
147 |
+
| instruction | 指导模型执行信息抽取任务的指示。 |
|
148 |
+
| output | 模型的预期输出结果。 |
|
149 |
+
| relation | 描述文本中包含的关系三元组,即实体间的联系(head, relation, tail)。 |
|
|
|
|
|
150 |
|
151 |
</details>
|
152 |
|