Тест по главе 5
Эта глава охватила много вопросов! Не волнуйтесь, если вы не поняли всех деталей; следующие главы помогут вам понять, как все работает внутри.
Однако, прежде чем двигаться дальше, давайте проверим то, что вы узнали в этой главе.
Из каких источников функция load_dataset() в 🤗 Datasets позволяет загружать наборы данных?
2. Предположим, вы загружаете одну из задач GLUE следующим образом:
from datasets import load_dataset
dataset = load_dataset("glue", "mrpc", split="train")
Какая из следующих команд создаст случайную выборку из 50 элементов из dataset
?
3. Предположим, у вас есть набор данных о домашних питомцах под названием pets_dataset , в котором есть столбец name , обозначающий имя каждого питомца. Какой из следующих подходов позволит вам отфильтровать набор данных для всех домашних животных, имена которых начинаются с буквы «L»?
4. Что такое отображение в память?
5. Что из перечисленного ниже является основным преимуществом отображения памяти?
6. Почему следующий код не работает?
from datasets import load_dataset
dataset = load_dataset("allocine", streaming=True, split="train")
dataset[0]