2. rész
A logikus és strukturált szövegek után következnének a szerkesztett, nem propagandisztikus szövegek. Ezek elsősorban a monográfiák és a sok nyelven kiadott tudományos könyvek lennének. Ezek után következne a tudományos folyóiratok megszámlálhatatlan sokasága. Méltán feltételezhetnénk, hogy ezekben nincs szándékos hazugság, de pontatlanság vagy írói szabadság lehet bennük. Így egy fejlett nyelvi modell jönne létre, amelynek az információi is megbízhatók, ezek megbízhatóságát az MI értékelné a mélyebb struktúra alapján.
Az MI talán nem bírna önálló nyelvi használattal, és működési elve lehet, csak statisztikus maradna, de ha a feltöltése kontrollált lenne, akkor egy igazat mondó, de legalábbis nem hazudó MI-t kapnánk. A mai MI-k nem tudják azt mondani, hogy „nem tudom”, ezt a lehetőséget be kellene építeni a működésébe, mégpedig alapegységként. Nem tudom, hogy ezek után az MI mennyire lenne érdekes, de azt hiszem, hogy pontos lenne, és kész arra, hogy a legnagyobb klasszikusokat feltöltsük, az eredeti nyelven kívül, lehetőség szerint minden olyan nyelven, amelyre lefordították őket, így lehetne Platón, Arisztotelész műveit, de a Zabhegyezőt/Rozsban a fogót is feltölteni. Nem is tudom, hogy hány klasszikus van, amellyel ezt meg lehet még tenni. Majd csak a nagy klasszikusok és fontos regények után kellene a nyelvi modellbe építeni az újságokat. De addig még van egy sor dolog. Ebben a fázisban nagyon fontos lenne a Bibliák feltöltése. A Biblia szövegében ugyanis jól megtalálható helyeken ugyanazok a jelentések vannak, csak más fordításban vagy más nyelven. A Bibliák feltöltése nagyon jó kapcsolódási pontokat nyújtanának a különböző nyelvekhez és a nyelveken belül is. Hasonló szerepe lenne a tudományos könyvek hivatkozásának is.
Azt hiszem, hogy a nagy klasszikusok után fokozatosan jönnének a kevesebb nyelvre lefordított szövegek, majd az olyanok, amelyek csak egy nyelven jelentek meg, de a szöveg nyelvi és stilisztikai szerkesztésen esett át. Mindezek után talán nem is lennének fontosak az újságok, de a nyelv állandó változása miatt az újságok feltöltése indokolt lenne. Ezekben már van propaganda, és egy eset több, eltérő értelmezése, amelyek felismerésére meg kellene tanítani az MI-t. Amikor már az MI kiszűri a hibákat, mindenféle írás feltölthető lenne, amelyet neves kiadó adott ki, aprólékos szöveggondozással. A releváns sajtótermékekre ugyanez vonatkozik, az országos napilapok a fontosabbak, majd a helyi napilapok és a magazinok, végül a bulvársajtó következne. Nem tudom, hogyan, de azt meg kell tanítani az MI-nek, hogy csak politikailag korrekt mondatokat, szövegeket írjon, lazább szöveget pedig csak külön kérésre.
6.
A lényeg az, hogy az MI ekkorra már jól ellenőrzött forrásokkal lenne feltöltve, amit az új könyvek tovább gyarapítanának, és az újságok is, így sokkal megbízhatóbb és precízebb lenne, nem ragadna bele a rosszul szerkesztett vagy félrevezető szövegek mintázataiba. Amikor már van egy meglehetősen nagy szöveganyag, akkor egy harmadik féle súlyozást is el lehetne kezdeni, ez pedig az lenne, hogy miről hányszor kérdezik.
Mindez alapján az MI először pontos nyelvi alapokat kapna (szótárak, nyelvtanok); majd pontos megfogalmazást tanulna (jogi szövegek és egyéb precíz leírások); majd pontos tárgyi tudást szerezne (lexikonok, enciklopédiák, kronológiák); utána mélyebb tárgyi tudást szerezne (tudományos szövegek: monográfiák, hiteles helyen kiadott szakkönyvek, folyóiratokban közölt szakcikkek); megtanulná a kereszthivatkozásokat (Biblia és szakirodalom); adatelemzést végezne a nem mindig pontos sajtótermékek megismerésével; naprakész lenne a napilapok által; megismerné a trendeket a kultúrában és a művészetekben a magazinok által; végül pedig a köznyelvet is megismerné az által, hogy a nyelvi mintáját a bulvársajtó nyelvének ismeretével gyarapítjuk. Az így felszerelt MI-t, (legalább) két helyre rögzítenék, de csak az egyiket használnák, amely követné (esetleg egy harmadik MI) a változásokat, ezeket beleillesztenék az alapbázisba, ahonnan pedig bizonyos idő múlva megjelenne a védett MI-ben. Így a beszéd mellett egy jól rétegzett, súlyozott tudásbázist kapna, és teljesen megbízható lenne (a „nem tudom” válasz és az „egyrészt-másrészt” válaszok miatt is).
Az MI esetében az udvarias beszéd is fontos lenne, de nem beszéd- és gondolatrendőrséget kell elképzelni, hanem azt, hogy megismerje és kerülje a trágár beszédet. Az alapértelmezett beszédmódja hivatalos és semleges lenne. Ha valaki lazább, szlenges szöveget akarna vele íratni, akkor sem más sértegetésére, azt az MI külön kérésre tenné csak. A csúnya jelzőket, a káromkodásokat meg lehet tanulni, szűrni lehet. Ilyesmikkel a néprajz is foglalkozik, de akár egy tanító is beviheti ezeket a rendszerbe. A cél nem az, hogy a jelentést cenzúrálja az MI, hanem az, hogy kulturált szövegeket szerkesszen, amikor válaszol. Amikor egy kifogásolható kifejezéssel vagy szószerkezettel találkozna, akkor annak nem a formáját, hanem a jelentését adná pontosan vissza. Nem lenne felesleges vulgaritás, a mondanivaló mégis érthető maradna. Nem torzulna a történelmi vagy kulturális kontextus.
Példa:
Egy trágár mondat: „Ő egy rohadt szemétláda."
Az MI így alakítaná át: „Őt egy rendkívül becstelen és tisztességtelen embernek nevezték."
Ez kompromisszum lenne az egyenes beszéd és a kulturált kommunikáció között.
Az MI fejlesztésében végül azok is részt vehetnének, akik írással foglalkoznak (újságírók, írók, költők). A friss szövegek nyelvi kalibrálást tennének lehetővé, ám az MI-nek abban is szerepe lehetne, hogy az írott nyelvbe ne szivárogjanak be a divatszavak, és egyfajta dinamikus konzerválása is lenne a nyelvnek, hiszen aki él, az meg fog halni, az MI pedig addig működik, amíg van erőforrása, tehát túlélhet generációkat, akár évszázadokat is. Jó lenne arra is gondolni, hogy a mai és az akkori írott és beszélt nyelv közérthető legyen. Ha írókat, fordítókat, újságírókat, tudósokat és más aktív szövegalkotókat bevonnának, akkor az MI jobban érzékelné a nyelv árnyalatait, hogy mi a pejoratív, szarkasztikus, archaikus vagy divatos, a nyelv naprakész lenne, azzal, hogy a hosszú távú megértéssel is foglalkozna. A mélyszerkezethez kapcsolná, hogy a szavak milyen kontextusban mit jelentenek. Az MI által használt nyelv talán soha nem lesz olyan élő, mint az élőbeszéd, de bizonyára kiszűrné a túlzott sterilitást. Úgy gondolom, hogy az MI-t nem szabad magára hagyni, kell lennie egy szakértői csoportnak, amely felügyeli és szűri az új nyelvi jelenségeket, a nyelvi divatokat időpontokhoz kötné, pl. a „jó”, „kitűnő” megfelelő kifejezésére a 2010-es években a „zsír”, „sirály”, „király” kifejezéseket használták, ami ma már nem divatos. Ha a jövőben valaki egy olyan szöveget akarna írni, amely ezt a korszakot felöleli, akkor az MI előhozhatná ezeket a szavakat, egyébként pedig a „jó”, „nagyszerű” szavakat használná. Ha a nyelvi modell stabil alapokra épülne, és nem lenne mindenféle szöveg által összeállított adathalmaz, akkor még sok mindenre használható lenne. Amit kiad magából, az pontos és következetes, rugalmas és aktuális lenne. A ma létező nyelvi MI-k talán javíthatók menet közben, de egyelőre nem teljesen jók, noha a fordításban egyre jobbak a nagy nyelvi modelleknek köszönhetően, ám a pontosságot minden esetben a felhasználónak kell ellenőriznie. Ha ez így marad, akkor a nyelvi MI-k sokkal lassabban fordítanának, hiszen szinte minden mondatukban valamit javítani kell, ezzel szemben ha oldalanként kellene egyet s mást javítani, akkor a teljesítmény megsokszorozódna, ami nem jelentené a természetes intelligencia elhagyását, de a természetesen intelligens ember sokkal többet lazíthatna, úgy, hogy közben több oldalt fordít le a számítógéppel és az MI-vel. Az új MI-tartalmakat a beviteli nyelv nyelvészei, írói, fordítói ellenőriznék, ezzel sok új munkahely nyílna, amire szükség is lenne, hiszen az MI sok mindent kivált.
7.
Azt hiszem, hogy nem jó az a szemlélet, amely szerint az MI-nek mindennel foglalkoznia kell, ehelyett az írott nyelvi modellel legalább egy, de lehetőleg több (minden országban a hivatalos nyelvekre alapozva) nagyon jól kialakított MI foglalkozhatna, a beszélt nyelvvel pedig egy másik (vélhetően minden országban a hivatalos nyelvekre alapozva), de akár a kihalóban lévő nyelvek is megérdemelnének egy MI-t. Mindenhol a feltöltés sorrendje, a súlyozás és a használat/lekérés lenne fontos.
A filmekkel és videóanyagokkal egy másik MI, a vizuális értékekkel (festmények, fotók) egy harmadik kellene hogy foglalkozzon, esetenként együttműködnének.
A nyelvvel kapcsolatos, de sokkal összetettebb dolog a beszélt és hangzó nyelv. Ennek az alapja a szövegekre felépített MI lenne, de a minőséges műsort sugárzó rádiók és tévécsatornák hanganyaga még ráerősítene az MI hatására. Nem lenne többé kérdés, hogy a szinkronizált vagy az eredeti nyelven bemutatott film jobb-e, és pillanatok alatt meg lehetne nézni így is, úgy is. A beszélt nyelv figyelése és beépítése a rendszerbe nyelvtanilag precíz, de életszerű hangzó szöveget eredményezne. A minőségi rádióműsorok, dokumentumfilmek és jól szerkesztett tévéműsorok és filmek kulcsfontosságúak lennének, mert az élő beszéd és a spontán párbeszédek segítenének az MI-nek megérteni a kontextuális jelentést, hangsúlyt, intonációt. Mindez azt is jelentené, hogy nem gépi hangon olvasna fel könyvet. A nyelvileg gyengébb, de érdekes tartalmakat feljavíthatná, ugyanúgy, ahogy a régi és sérült filmeket is. Persze ehhez képfelismerő MI is kellene. Ha a hangzó anyagok súlyozását is kidolgoznák, akkor megbízható és minőségi köznyelvi tartalmakat is szolgáltathatna. Az MI megtanulná a standard beszédet, de a nyers, hétköznapi beszédet is, amelyet ugyanígy képes lenne kulturált formába önteni. Ehhez az kell, hogy a komolyan megszerkesztett műsorokat figyelje, az eddig szinkronizált és eredeti filmeket összehasonlítsa. A lehetőségek végtelenek, és rengeteg emberre (természetes intelligenciára) lesz szükség.
A mesterséges intelligencia önmagában se nem jó, se nem rossz, ám így is, úgy is lehet használni. A meglévő rendszerek bővülnek, a politikumnak pedig el kell gondolkodnia a szabályzáson, és azon, hogy az MI-t etikusan használják, például úgy, hogy a fordító, a fordítások ellenőrzőjévé válik. Így ez egyszerre hozna tudományos virágzást és társadalmi jólétet.
(Készült a ChatGPT-vel vitatkozva és együttműködve)
