章末小测试
本章涵盖了很多方面! 如果你没有掌握所有细节, 不用担心; 在下一章将帮助你了解内部的事情是如何工作的。
不过, 在继续下一章之前, 让我们测试一下你在本章学到的内容。
1.🤗 Datasets中的 load_dataset () 函数允许你从下列哪个位置加载数据集?
2.假设您加载了 GLUE 任务,如下所示:
from datasets import load_dataset
dataset = load_dataset("glue", "mrpc", split="train")
以下哪个命令将从 dataset
中生成50个元素的随机样本?
3.假设你有一个叫做宠物数据集的家庭宠物数据集,它有一个名字列表示每个宠物的名字。下列哪种方法可以让你过滤所有名字以字母”L”开头的宠物的数据?
4.什么是内存映射?
5.下列哪一项是内存映射的主要好处?
6.为什么下面的代码是错误的?
from datasets import load_dataset
dataset = load_dataset("allocine", streaming=True, split="train")
dataset[0]