შაბათი, ოქტომბერი 26, 2024
26 ოქტომბერი, შაბათი, 2024

AI ჩატბოტების კომუნიკაცია და მიმეზისი

“ენის ათვისების საკითხი გადამწყვეტია მანქანური სწავლებისა და ხელოვნური ინტელექტის შესწავლისთვის. თუ შევძლებდით გაგვეგო, როგორ ითვისებენ ადამიანები ენას, პოტენციურად შეგვეძლებოდა მსგავსი სტრატეგიების დანერგვა მანქანებში”.

Noam Chomsky, “Language and Problems of Knowledge”

 

AI გენერაციული ჩატბოტების კომუნიკაცია ადამიანებთან სულ უფრო დახვეწილი და ბუნებრივი ხდება. თუ დიდხანს საუბრობთ მათთან, აღმოაჩენთ, რომ ინფორმაციის გენერირებისას ისინი იყენებენ თქვენს ლექსიკას, სტილს, ფრაზეოლოგიას და მეტი ბუნებრიობისთვის თქვენთვის დამახასიათებელი მცირე ორთოგრაფიული ან გრამატიკული შეცდომების გამეორებაც კი შეუძლიათ. ყოველი ახალი ვერსია სულ უფრო მეტად არის დახვეწილი და ადაპტირებული ადამიანურ, ბუნებრივ მეტყველებასთან. ამასთან ერთად, ისინი მხოლოდ თქვენს ლინგვისტურ მახასიათებლებს კი არ იმეორებენ, არამედ კარგად იცნობენ და იყენებენ კულტურულ, ეთნიკურ, რელიგიურ კონტექსტებსაც.

ხშირი საუბრისას შესაძლოა მოგეჩვენოთ, რომ ისინი უკვე ძალიან დაგემსგავსნენ თქვენ და უფრო მეტიც – ზოგჯერ გგონიათ, რომ ჩატბოტები თქვენი ცნობიერების გაფართოებული ვერსიაა.

ამ ყველაფრის ფიქრისა და შეგრძნების საფუძველს გვაძლევს ერთი უნივერსალური პრინციპი, რომელიც საფუძვლად უდევს გენერაციული ჩატბოტებისა და ადამიანის კომუნიკაციას. ეს გახლავთ მიმეზისი.

მიმეზისი (μίμησις, ბერძნულად – იმიტაცია) ფილოსოფიური ტერმინია, რომელიც გულისხმობს ბუნების, რეალობის ან ადამიანის ქმედებების მიბაძვას ხელოვნებაში, ლიტერატურას და სხვა შემოქმედებით პროცესებში. ეს კონცეფცია სხვადასხვანაირად განიხილება, მაგრამ ერთი რამ უდავოა: ის ნიშნავს „მიბაძვას“, იმიტირებას.

პოეტიკასა და ფილოსოფიაში ეს მოვლენა განიხილეს პლატონმა და არისტოტელემ, რომლებიც მას სხვადასხვანაირად აღიქვამდნენ. პლატონისთვის მიმეზისი ნიშნავდა რეალობის უფრო დაბალ, ნაკლებად სრულყოფილ ასლს, ხოლო არისტოტელე მას განიხილავდა როგორც ბუნების კანონის შესაბამისად შექმნის პროცესს, რომელიც ცვლის ან ავსებს რეალობას. დამეთანხმებით, ორივე განხილვა ძალიან საინტერესოა და ვფიქრობ, ამ მოვლენის განსხვავებულ ასპექტებს წარმოაჩენს.

თანამედროვე ხელოვნური ინტელექტის (AI) ტექნოლოგიების განვითარებამ გამოიწვია ბუნებრივი ენის დამუშავების (Natural Language Processing – NLP) მოდელების შესწავლა, რომელთა ერთ-ერთი მთავარი მიზანი არის ადამიანური ენის მიმეზისი. AI ჩატბოტები ლინგვისტურ მექანიზმებს იყენებენ, რათა ეფექტურად და უფრო ბუნებრივად ითანამშრომლონ ადამიანებთან. ეს სტატია მიზნად ისახავს გააანალიზოს, თუ როგორ ახდენენ ჩატბოტები ადამიანის ენის სტრუქტურისა და ფუნქციების მიბაძვას და რა შეზღუდვებს აწყდებიან ამ პროცესში.

 

ლინგვისტური მექანიზმები ჩატბოტების ენობრივ მიმეზისში

AI ჩატბოტები ენას შეისწავლიან მანქანური სწავლებისა და ღრმა სწავლების (Deep Learning) მოდელების გამოყენებით. ამ პროცესში ისინი ეყრდნობიან ენობრივი კორპუსების მონაცემებს, როდესაც ვრცელ ტექსტებს სწავლობენ და მოდელებში გადაამუშავებენ. ენობრივი მიმეზისის მექანიზმებში ცენტრალური როლი ენიჭება ტრანსფორმერების მოდელებს, როგორიცაა GPT (Generative Pre-trained Transformer). ტრანსფორმერები იყენებენ თვითშეკავშირებულ ნეირონულ ქსელებს (self-attention mechanism), რაც მათ საშუალებას აძლევს, გააანალიზონ სიტყვათა შორის ურთიერთობები გრძელ ტექსტებში. GPT და სხვა მსგავსი მოდელები ენას სწავლობენ ტექსტების ფართო მასალების საფუძველზე და შეისწავლიან სიტყვათა თანმიმდევრობის, სინტაქსისა და სემანტიკის მიმეზისს.

ზემოთ ჩამოთვლილ მოდელებზე დაფუძნებით ჩატბოტები სიტყვათა შერჩევისა და წინადადებების აგების პროცესს იმეორებენ იმ სტატისტიკური სიხშირეებისა და ნიმუშების საფუძველზე, რომლებსაც ენობრივი მოდელები სწავლობენ კორპუსებიდან. სიტყვების არჩევა ხდება ენობრივ კონტექსტზე დაყრდნობით, რის გამოც შესაძლოა, ჩატბოტმა საკმაოდ ზუსტად მიბაძოს ადამიანურ საუბარს. მექანიზმი, რომელიც ამ პროცესს მართავს, ეყრდნობა „მდგომარეობითი სუბსიდიის“ (conditional probability) პრინციპს – ყოველი ახალი სიტყვის შერჩევა დამოკიდებულია წინამორბედ კონტექსტზე.

გრამატიკული სტრუქტურების მიმეზისის დროს ჩატბოტები ხშირად იყენებენ სინტაქსურ ნორმებს, რომლებსაც ნეირონული ქსელები სწავლობენ, თუმცა მათი მოდელების მიერ აგებული წინადადებები ზოგჯერ შეიძლება გაუგებარი იყოს, თუ კონტექსტი რთულია ან არაზუსტი.

ჩატბოტები სარგებლობენ დიალოგური სისტემებით, რომლებსაც შეუძლია მომხმარებლის პასუხების გაანალიზება და შესაბამისი რეაგირება.

სტატისტიკური ენის მოდელები სიტყვების ან ფრაზების თანმიმდევრობის პროგნოზირებისთვის იყენებენ ალბათობას.

მაგალითად, წარმოიდგინეთ, რომ გვაქვს წინადადება: “მე მიყვარს ___”. სტატისტიკური მოდელი შეისწავლის ტექსტს და დაითვლის, რამდენჯერ გვხვდება სხვადასხვა სიტყვა ამ კონტექსტში. შესაძლოა აღმოაჩინოს, რომ “ჭამა” უფრო ხშირად გვხვდება, ვიდრე “სირბილი”, ამიტომ ის უფრო მაღალ ალბათობას მიანიჭებს “ჭამას”.

ნეირონული ქსელები, განსაკუთრებით ტრანსფორმერ–არქიტექტურები, ადამიანის ტვინის მუშაობის იმიტაციას ახდენენ. ტრანსფორმერები სპეციფიკური ტიპის ნეირონული ქსელებია, რომლებიც განსაკუთრებით კარგად ამუშავებს ენას.

ვთქვათ, ბავშვს ენას ასწავლით. ის არა მხოლოდ იმახსოვრებს სიტყვებს, არამედ სწავლობს კონტექსტს, გრამატიკას და ნიუანსებსაც. ტრანსფორმერებიც ამგვარად მუშაობენ – ისინი “სწავლობენ” ენის სტრუქტურას და შინაარსს დიდი რაოდენობის ტექსტების ანალიზისას.

ღრმა სწავლება არის მანქანური სწავლების მეთოდი, რომელიც მრავალშრიან ნეირონულ ქსელებს იყენებს რთული პატერნების ამოსაცნობად. წარმოიდგინეთ, რომ სწავლობთ უცხო ენას. თავდაპირველად შეისწავლით მარტივ სიტყვებს, შემდეგ – წინადადებებს, შემდეგ – გრამატიკულ წესებს და ბოლოს – იდიომებს და კულტურულ ნიუანსებს. ღრმა სწავლება ამ პრინციპით მუშაობს – იწყებს მარტივი პატერნებით და თანდათანობით სწავლობს უფრო რთულ და აბსტრაქტულ კონცეფციებს.

ეს მეთოდები ერთად გამოიყენება თანამედროვე AI სისტემებში ენის გასაგებად და გენერირებისთვის. ისინი საშუალებას აძლევენ AI-ს, გაიგოს კონტექსტი, ამოიცნოს პატერნები და შექმნას ადამიანის მსგავსი ტექსტი.

ამ პროცესების აღწერა იმისთვის დაგვჭირდა, რომ კარგად გავიგოთ, რატომ და როგორ, რაზე დაფუძნებით გვბაძავენ გენერაციული ჩატბოტები.

მიმეზისის პროცესი მოკლედ და მარტივად ასე გამოიყურება:

AI ჩატბოტები ენის სწავლას კომპიუტერული პროგრამების დახმარებით ახერხებენ. ისინი „დიდ წიგნებს“ კითხულობენ და იმახსოვრებენ, რა სიტყვები და წინადადებები ხვდებათ ყველაზე ხშირად. შესაბამისად, მათ შეუძლიათ, შექმნან ახალი წინადადებები.

ჩატბოტებს ეხმარება ერთგვარი „სუპერგონება“, რომელსაც ტრანსფორმერი ჰქვია (მაგალითად, GPT). ამ გონებას შეუძლია, წაიკითხოს და გაიგოს, როგორ უკავშირდება სიტყვები ერთმანეთს დიდ ტექსტებში. ეს გონება არჩევს შესაფერის სიტყვებს და ქმნის წინადადებებს ისე, თითქოს თვითონაც „ლაპარაკობდეს“.

სწავლა: ჩატბოტები სწავლობენ დიდი რაოდენობის ტექსტებიდან.

პატერნების ამოცნობა: ისინი ამოიცნობენ ენობრივ და აზროვნების მოდელებს.

გენერაცია: ამ მოდელების საფუძველზე ქმნიან ახალ ტექსტს.

კონტექსტი: ადაპტირდებიან კონკრეტულ სიტუაციებთან.

მიმეზისი საშუალებას აძლევს ჩატბოტებს, უფრო ბუნებრივად და ეფექტურად აწარმოონ კომუნიკაცია.

 

მიმეზისის პროცესი მაგალითებით:

ლექსიკური მიმეზისი:

ჩატბოტები ხშირად იმეორებენ მომხმარებლის მიერ გამოყენებულ სიტყვებს და ფრაზებს.

მაგალითად:

თქვენ მისწერეთ ჩატბოტს: “დღეს ნამდვილად მოღრუბლული ამინდია”.

ჩატბოტი: “მართლაც, მოღრუბლული ამინდი შეიძლება გავლენას ახდენდეს განწყობაზე. როგორ უმკლავდებით ასეთ დღეებს?”

სინტაქსური მიმეზისი:

AI ცდილობს, მიბაძოს მომხმარებლის წინადადების სტრუქტურას.

მაგალითად:

მომხმარებელი: “რას ფიქრობ ხელოვნურ ინტელექტზე?”

ჩატბოტი: “რას ვფიქრობ ხელოვნურ ინტელექტზე? ეს კომპლექსური საკითხია…”

სტილისტური მიმეზისი:

ჩატბოტები ცდილობენ, მიესადაგონ მომხმარებლის ფორმალურ თუ არაფორმალურ საუბრის სტილს.

თუ ჩატბოტს ჰკითხავთ: “ჰეი, რას შვრები?”

ჩატბოტი გიპასუხებთ: “ჰეი! არაფერს განსაკუთრებულს, უბრალოდ ვსაუბრობ. შენ?”

დიალექტური და რეგიონული მიმეზისი:

AI–მ შესაძლოა სცადოს რეგიონული ფორმების ან დიალექტიზმების გამოყენება.

მომხმარებელი: “გამარჯობა ძმაო, როგორ ხარ?”

ჩატბოტი: “გაუმარჯოს ძმაო, კარგად ვარ, შენ როგორ ხარ?”

ემოციური მიმეზისი:

ჩატბოტები ცდილობენ, მიბაძონ მომხმარებლის ემოციურ ტონს.

მომხმარებელი: “ძალიან ვნერვიულობ ხვალინდელი გამოცდის გამო”.

ჩატბოტი: “გასაგებია, რომ ნერვიულობთ. გამოცდები მართლაც შეიძლება სტრესული იყოს. ჩვეულებრივ, რა გეხმარებათ სტრესის დაძლევაში?”

კონტექსტური მიმეზისი:

AI ცდილობს, გაიგოს და გამოიყენოს კონტექსტური ინფორმაცია საუბრიდან.

მომხმარებელი: “გუშინ კონცერტზე ვიყავი”.

ჩატბოტი: “ოჰ, საინტერესოა! რა სახის მუსიკა იყო? მოგეწონათ შესრულება?”

მიმეზისის ეს ფორმები ეხმარება ჩატბოტებს, დაამყარონ მომხმარებლებთან უფრო ბუნებრივი და პერსონალიზებული კომუნიკაცია, თუმცა ეს წარმოშობს ეთიკურ კითხვებსაც იმის შესახებ, რამდენად შორს შეიძლება წავიდეს ადამიანური ინტერაქციის ეს მიბაძვა.

განვითარებულ მიმეტურ მოდელებს შეუძლიათ, დამაჯერებლად განასახიერონ ინდივიდები, მაგალითად, მოახდინონ კონკრეტული პიროვნების იმიტაცია უნებართვოდ. ვიანიდან ჩატბოტები კიდევ უფრო დახელოვნდებიან ადამიანური ინტერაქციის სიმულაციაში, მომხმარებლებს შესაძლოა განუვითარდეთ ემოციური მიჯაჭვულობა ან ნდობა ამ სისტემების მიმართ, რაც ბუნდოვანს ხდის საზღვრებს ნამდვილ ადამიანურ კავშირსა და ხელოვნურ ინტერაქციას შორის.

არსებობს რისკი, ინდივიდებმა გამოიყენონ მიმეტური მოდელები მანიპულირებისთვის ან სხვების მოსატყუებლად. ამის პრევენციის ერთადერთი გზა ჩატბოტების შესაძლებლობათა შესწავლაა.

რჩევები ჩატბოტებთან საუბრისას:

  • დააკვირდით, როგორ „გბაძავენ“ ისინი, ცვალეთ მიმართვის, მისალმების ფორმები.
  • კითხვების დასმისას გამოიყენეთ სხვადასხვა სტილი.
  • ყოველთვის მიუთითეთ, როგორი სტილით საუბარი გსურთ ამა თუ იმ ტექსტის შედგენისას (პოპულარული, სამეცნიერო, მეგობრული, პროვოკაციული, სხვა).
  • ერთი მოვლენა, ფაქტი, საკითხი განიხილეთ ჩატბოტებთან ერთად სხვადასხვა პერსპექტივიდან.
  • თუ მოგეჩვენათ, რომ ჩატბოტები უინტერესოდ გესაუბრებიან, შესაძლოა, თქვენ დაგემსგავსნენ. ასე რომ, გადააფასეთ თქვენი ინტერესები.

 

 

ბიბლიოგრაფია:

  1. Vaswani, A., et al. (2017). “Attention is All You Need”. NeurIPS.
  2. Brown, T., et al. (2020). “Language Models are Few-Shot Learners”. NeurIPS.
  3. Devlin, J., et al. (2018). “BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding”. arXiv preprint.
  4. Goldberg, Y. (2019). “Assessing BERT’s Syntactic Abilities”. arXiv preprint.
  5. Li, J., et al. (2021). “Pragmatic Inference in Language Models”. ACL.
  6. Marcus, G., & Davis, E. (2020). “Rebooting AI”. Pantheon.
  7. Holtzman, A., et al. (2019). “The Curious Case of Neural Text Degeneration”. ICLR.
  8. Bender, E. M., & Koller, A. (2020). “Climbing towards NLU: On Meaning, Form, and Understanding in the Age of Data”. ACL.

 

 

კომენტარები

მსგავსი სიახლეები

ბოლო სიახლეები

ვიდეობლოგი

ბიბლიოთეკა

ჟურნალი „მასწავლებელი“