ChatGPT сдерживает прогресс в области ИИ
Согласно информации, опубликованной в The Register, огромное количество контента, сгенерированного ИИ, доступно для обучения будущих генеративных моделей. Однако поиск действительно ценной информации среди этого массива становится затруднительным.
В результате, контент, созданный до активного внедрения ChatGPT и аналогичных нейросетей, приобретает особую ценность, так как считается более «надежным, качественным и незамутненным».
Уже несколько лет исследователи предупреждают о проблеме загрязнения интернета и отмечают, что его очистка может оказаться либо чрезвычайно затратной, либо вовсе невозможной задачей.
В частности, загрязнение сети усложняет процесс генерации расширенного поиска (RAG), необходимого для поиска актуальных данных при использовании ИИ. Модели могут формировать свои ответы на базе ранее созданного ИИ-контента, что приводит к выдаче менее надежных результатов. Эксперты предлагают маркировку ИИ-контента как один из возможных путей решения этой проблемы.