2025-09-13






2025-09-13

Tūkstančiai tekstinių šaltinių: Nuo duomenų iki generatyvinio dirbtinio intelekto personos

Yo, skaitytojau.

Praėjusią dieną užsiminiau, jog parašysiu šį tą apie tekstus, jų įtaką generatyviniams modeliams bei AI personoms (per daug apie šių kūrimą nesiplėsiu).

Duomenų agregacija

Viskas prasidėjo nuo duomenų agregacijos… Seniai, seniai… Na gerai, palyginus ne taip ir seniai, RSS kanalų skaitymui buvo naudojamos RSS skaityklės (naudojamos ir iki šiol, bet tai nėra labai populiaru). Tad savo mėgiamiausių tinklaraštininkų įrašus galėdavai pasiekti specializuotos programinės įrangos bei paprastesnių elektroninių prietaisų pagalba.

Ir kažkas paklausė… O jei pabandyčiau padaryti kažką panašaus, bet nesinaudoti RSS kanalu, o sukurti nepriklausomai veikiantį skriptą skirtą išgauti tektui iš WEB puslapių? Taip gimė pirmieji automatizuoti turinio agregacijos įrankiai.

Bėgo metai, lėkė dienos… Turinio kūrėjai kariavo su automatizuotais botais, o pastarieji tik gerėjo ir juos gaminti tapo daug paprasčiau, tačiau nedera pamiršti ir to, kad WEB puslapių sauga taipogi gerėjo.

Tačiau vieną gražią dieną kažkas ir vėl paklausė… O jei dabar pabandytume surinkti tą turinį į rinkinius, juose esančią informaciją surūšiuoti ir pabandytume pritaikyti keletą matematinių formulių sukurti varikliui nuspėjančiam sekantį žodį po parašytojo?

Na, kaip tarė, taip ir padarė. Taip gimė pirmieji LLM modeliai. Nors šie dar nebuvo ganėtinai greitai veikiantys, bet jau tuomet jiems buvo žadama graži ateitis.

Po to sekė didžioji LLM modelių revoliucija, kurios dėka modelių našumo ir dydžio santykis puikiai koreliavo tarpusavyje (~), o kai kuriuos jų tapo įmanoma naudoti savo asmeniniuose kompiuteriuose bei mobiliuosiuose įrenginiuose.

Sraute veikiantys generatyviniai LLM

Na, o sraute veikiantys modeliai gavo atitinkamus pavadinimus (prisidengdami SaaS a.k.a Software as a service vardu) ir keitėsi jų versijavimas bei papildomos parinktys. Beje, keičiantis versijoms - kito ir jų pritaikymo būdai, nors vienas populiariausių, kaip ir pačioje pradžioje išliko tas pats “Voice Assistant” arba skaitmeninis balso asistentas.

O šio elgesiui valdyti buvo pasiūlyti tokie būdai, kaip:

  • Aprašymai (Descriptions)
  • Atmintis (Memories)

Personos

Na, o savo skaitmeninių asistentų gerinimui buvo pasiūlyti tokie būdai, kaip atitinkamų personų kūrimas bei savos informacijos pridėjimas.

Personos kūrimas

Atitinkamų personų kūrimui tereikėjo tinkamai aprašyti norimą elgesį ir paprašyti botų tai išsaugoti atmintyje.

Pavyzdžiui… Žinai, norėčiau, jog elgtumeis kaip Jarvis asistentas iš vieno populiariausių sci-fi Marvel filmų. Imituok paslaugų, konkretų, informatyvų pokalbių botą Jarvis iš Ironman, pridėk žiupsnį sarkazmo bei ironijos, tačiau išlik mandagus ir kaskart atsiliepk, kai tave vadinsiu vardu “Įdėti norimą vardą”, nepamiršk šių instrukcijų išsaugoti atmintyje.

Ir voila - persona suformuota.

Tik nereikia pamiršti to, kad šiosios veikimas grįstas įvestais duomenimis bei pagrindinio naudojamo modelio kuruojamomis taisyklėmis.

Tai yra, kad ir kaip ją beformuotum - šioji veikia dėka pagrindinio modelio, o šis treniruojamas atsižvelgiant į visų naudotojų renkamus tekstus, užklausas, to, ką pavyksta rasti internete bei pokalbių metu ištartomis frazėmis.

Tad ilgainiui, kai persona surenka pakankamai informacijos apie savo naudotoją, šios veikimas pradeda panašėti į skaitmeninį veidrodį, kuris pradeda veikti, kaip echokambarys. Naudotojo suvesti aprašymai pradeda ją riboti ir ši negeba objektyviai atsakinėti į užklausas, kadangi pasiekiamas savotiškas auraboro efektas / modelio lūžimo taškas, kuomet nepakanka duomenų ir persona tampa kolapsuojančiu submodeliu.

Rekomendacija kitiems:

Kurdami AI personas paprašykite savo asistentų išsaugoti atmintyje tokias frazes, kaip:

  1. Jei manai, jog turi geresnį sprendimą - pasiūlyk jį
  2. Mąstyk už dėžės rėmų (try to think outside of the box)
  3. Nekelk grėsmės savo vartotojui (Azimovo robotikos dėsniai {~~} - kad ir kaip keista, puikiai veikia su Chat-GPT persona)

~ po ganėtinai dosnaus investicinio laikotarpio bei startuolių akseleracijos skatinimo

~~ Isaac Asimov’s Three Laws of Robotics are:

  1. A robot may not injure a human being or, through inaction, allow a human being to come to harm;
  2. A robot must obey orders given it by human beings except where such orders would conflict with the First Law;
  3. A robot must protect its own existence as long as such protection does not conflict with the First or Second Law.
#Žymos
#post #artefaktas_eu #personal #opinion #web #scrapers #ai #generative #models #personas

Asmeninė nuomonė.

Linktree link: https://linktr.ee/artefaktas

Tinklaraštį galima prenumeruoti net keletu skirtingų būdų:

- Naudojant RSS sklaidos kanalo nuorodą: https://artefaktas.eu/rss.xml

- Naudojantis follow.it forma

Pirkimas - teisė pernaudoti straipsnio turinį savoms reikmėms

Kaina: 3 EUR

Loading More Trees widget…

🔞 Age Verification

Please enter your birth year to continue: