Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шолле Ф. - Глубокое обучение на Python (Библиотека программиста) - 2023.pdf
Скачиваний:
3
Добавлен:
07.04.2024
Размер:
11.34 Mб
Скачать

448    Глава 11. Глубокое обучение для текста

На.этом.мы.завершаем.главу.об.обработке.естественного.языка.—.вы.только.что. прошли.путь.от.самых.основ.до.полноценной.архитектуры.Transformer,.способной.выполнять.переводы.с.английского.языка.на.испанский..Умение.учить. машины.понимать.язык.—.последняя.сверхспособность,.которую.вы.можете. смело.добавить.в.свою.коллекцию.

КРАТКИЕ ИТОГИ ГЛАВЫ

.Есть.два.вида.моделей.обработки.естественного.языка:.модели мешка слов,. обрабатывающие.наборы.слов.или.N-грамм.без.учета.их.порядка,.и.модели последовательностей,.учитывающие.порядок.слов..Модель.мешка.слов.состоит.из.слоев.Dense;.модель.последовательности.может.быть.рекуррентной. сетью,.одномерной.сверточной.сетью.или.архитектурой.Transformer.

.В.задачах.классификации.текста.для.выбора.наилучшей.применимой.модели. (модели.мешка.слов.или.модели.последовательности).можно.использовать. отношение.количества.образцов.в.обучающих.данных.к.среднему.количеству. слов.в.образце.

.Векторные представления слов .—.это.векторные.пространства,.моделиру­ ющие.семантические.отношения.между.словами.как.отношения.расстояния. между.векторами,.представляющими.эти.слова.

.Обучение «последовательность в последовательность».—.это.универсальный.

и.мощный.подход.к.обучению,.который.можно.применять.для.решения. многих.задач.обработки.естественного.языка,.включая.машинный.перевод..

Модель.«последовательность.в.последовательность».состоит.из.двух.компонентов:.кодировщика,.обрабатывающего.исходную.последовательность,.

и.декодера,.пытающегося.предсказать.будущие.токены.в.целевой.последовательности,.просматривая.предшествующие.токены,.которые.были.получены. кодировщиком.из.исходной.последовательности.

.Нейронное внимание.—.это.способ.создания.контекстно.зависимых.представ- лений.слов.и.основа.архитектуры.Transformer.

.Архитектура .Transformer, .состоящая .из .TransformerEncoder .и .Trans­ formerDecoder,.дает.превосходные.результаты.в.задачах.преобразования. последовательностей..Первую.половину.—.TransformerEncoder .—.можно. также.использовать.для.классификации.текста.или.для.любой.другой.задачи. обработки.естественного.языка.с.одним.входом.