...дълго е, обаче не смея да пипна нищо, не съм чак толкова изкушен по тези въпроси, нека разбирачите коментират и помогнат, благодаря за разбирането (това предишното не е генерирано от изкуствен интелект) ...надявам се София да е добре, да се разконспирира и да ни обясни вещо за какво иде реч, и за това благодаря...
-----
от Фредерик Каплан
КАК да разпознаем текст, създаден от ChatGPT или друг подобен инструмент? Преподаватели, редактори и журналисти се сблъскват с този проблем всеки ден.
Един от отговорите е да се открият повтарящите се езикови форми, използвани от тези инструменти. Оказва се, че те са вдъхновени от латинското ораторско изкуство, а тяхното повсеместно присъствие застрашава езиковото разнообразие.
Една особена ритмичност се налага дискретно, но масово в много от текстовете, създадени и разпространявани в цифровата среда. Среща се в социалните мрежи, в блогове, а понякога дори и в статии в пресата – на английски, френски и много други езици.
Тази нов „почерк“ се основава на честата употреба на две основни стилистични фигури.
Първата се състои в свързване на два израза с противоположен или променящ се смисъл – чрез конструкции като: „Не е това, а по-скоро онова“ или „Не само…, но и…“.
Първият израз създава очакване или предположение; вторият го преобръща – било чрез противопоставяне, било чрез изненадващо допълнение. Нека наречем тази стилистична фигура „реверсивен диптих“.
Втората структура разчита на троична ритмика: последователност от три елемента, които се усилват или допълват. Може да са три глагола, три кратки фрази или градация в три стъпки към по-интензивна идея: „система, която ограничава, която засилва, която заключва“. Ще я наречем „ритмичен триптих“.
Ето например пасаж с два примера на реверсивен диптих: „Фигури като Сам Алтман, Илон Мъск или Питър Тийл не просто ръководят технологични компании; те активно оформят обществените политики и представите за бъдещето. Тяхната сила се крие не само в богатството им, а в способността им да определят кое изглежда неизбежно или желателно“. Този откъс е генериран от езиковия модел GPT-4o на ChatGPT по следната задача: „Напиши блог пост въз основа на статия на Евгений Морозов със следния линк“. Разбира се, оригиналната статия не съдържа нито един реверсивен диптих.
Ако повторим заявката, новият текст от GPT започва с реверсивен диптих, а малко по-нататък включва ритмичен триптих: „Те вече не просто финансират иновации. Те искат да пишат история. И не каква да е, а своята. В Силициевата долина се появяват нов вид участници в глобалния интелектуален дебат –интелектуалците олигарси. Амбицията им? Да преосмислят какво означава да живееш, да работиш, да мислиш… в ерата на изкуствения интелект“.
Трета версия на текста съдържа реверсивен диптих, който включва и ритмичен триптих: „Не става дума за пълно отхвърляне на всички идеи, родени в техносферата. А за повторно въвеждане на плурализъм, дебат, несъгласие“. Всеки може лесно да направи този прост експеримент и сам да установи постоянното присъствие на тези две стилистични фигури в повечето генерирани текстове.
Тези структури вероятно звучат познато – като акорди, които слушаме още от детството си. Те напомнят слогани и лесно се запомнят. „Не целта е важна, а пътят“; „Дойдох, видях, победих“.
Произходът им препраща най-малкото към латинската реторика. Цицерон например говори за използването на компактни и симетрични структури, редуващи се с опозиции (теза/антитеза), както и тройни изброявания, наричани tricolon. В Античността реверсивният диптих и ритмичният триптих вече са съществували като минимална стилистична граматика, способна да организира кратки и въздействащи речи. Единият създава повествователен обрат; другият – градация на интензивността.
Формално хомогенизиране
В цифровите платформи някои текстове, изглежда, се изграждат почти изцяло от тези два шаблона. Като че ли идват от комбиниращ алгоритъм, основан на определен набор от операции: въведение с ритмичен триптих, реверсивен диптих, следван от друг реверсивен диптих, чийто завършек съдържа нов триптих… и така нататък. Тази механична систематичност е сигурен индикатор за алгоритмично генериране. Защото едно такова формално хомогенизиране произтича от самия процес на обучение на езиковите модели – процес, основан на статистическа компресия на огромни текстови масиви, с цел да се оптимизира прогнозирането на по-нататъшни последователности. Техниката поражда повтарящи се езикови форми – атрактори, към които машината естествено се връща.
Остава загадка защо компресията и статистическата обработка на текстови масиви водят до повторна поява на тези реторически форми – сякаш латинското ораторско изкуство е преоткрито от този модел в милиарди откъси, невидима, но основополагаща структура на речта, която днес може да бъде използвана като шаблон за генериране на текстове, пригодени да ангажират читателя.
Липсата на тези фигури, разбира се, не гарантира, че текстът е създаден от човек. Възможно е езиковият модел да бъде инструктиран да избягва видимите атрактори – например като му се забрани да използва реверсивни диптихи или тройни ритмични конструкции. Но това само измества проблема: генерираната последователност ще се върне към други, просто по-рядко срещани атрактори. Всеки текст, генериран от езиков модел, неизбежно носи отпечатъка на статистическите зависимости, по които този модел е бил обучен.
Това уеднаквяване на езика беше предвидимо. То е резултат от икономическата логика на натрупване, моделиране и посредничество, присъща на лингвистичния капитализъм (2). Фактът, че можем с просто око да разпознаем тези две на пръв поглед дребни фигури, може би свидетелства за мащабен процес на реконфигуриране на текста.
Феноменът става още по-притеснителен, тъй като генерирани текстове сега се използват за обучение на бъдещи езикови модели. Скоро тези модели няма да се захранват от предимно първични човешки източници, а ще включват все по-голям дял „замърсени“ текстове, създадени от други модели. Този цикъл ще усилва специфичните форми и ритми, насочвайки езиковата еволюция – итерация след итерация – към една дълбоко несигурна съдба.
Започва надпревара с времето: да се идентифицира възможно най-бързо „почеркът“ на тези текстове, за да бъдат те изключени от бъдещите набори от данни за обучение – нещо, за което самите езикови модели могат да допринесат. И освен това – да се открият други, по-дискретни, но също толкова структуриращи модели, залегнали в основата на генерираните текстове. Както би написал GPT: „Това не е само въпрос на реторика, става дума за многообразието, езика и мисленето“.
Фредерик Каплан
*Професор по цифрови хуманитарни науки във Федералното политехническо училище в Лозана. Автор на La Métamorphose des objets (Метаморфоза на предметите), FYP Editions, Limoges, 2009, и заедно с Georges Chapoutier на L’Homme, l’Animal et la Machine (Човекът, животното и машината), CNRS Editions, Paris, 2011.