
Мы исследуем структуру детерминированной генерации текста в языковой модели GPT-2, анализируя её пространство вложений с помощью контролируемых фазовых деформаций. Варьируя состояние вложений в ортогональных двумерных подпространствах, сохраняя при этом подсказку неизменной, мы наблюдаем, что генерация текста организуется в конечное множество стабильных и воспроизводимых режимов. Сопоставление этих режимов с несколькими фазовыми плоскостями выявляет дискретный фазовый ландшафт, состоящий из областей притяжения, разделенных резкими, зависящими от направления границами. В то время как вблизи исходной конфигурации вложения доминирует один базовый режим, достаточно сильные фазовые деформации вызывают резкие переходы в альтернативные стабильные режимы. Расположение этих переходов сильно варьируется в зависимости от направления в пространстве вложения, что указывает на выраженную анизотропию лежащей в основе геометрии. Анализ распределения вероятностей первого токена показывает, что альтернативные режимы часто связаны с более резкими распределениями выходных данных, хотя энтропия изменяется немонотонно с фазовой деформацией и не определяет строгий параметр порядка. В целом, наши результаты показывают, что детерминированная генерация в языковых моделях трансформеров может рассматриваться как фазоподобный динамический процесс со сложной анизотропной структурой, которая не может быть описана простыми мерами сходства в пространстве вложений.
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
