ენის დოკუმენტირება – წარსული, აწმყო და გამოწვევები

თანამედროვე საკლასო ოთახებში მოსწავლეების უმრავლესობას ენა მხოლოდ მათ სახელმძღვანელოებში ჩაწერილი გრამატიკული წესების ცოდნა ჰგონია და ვერც კი წარმოუდგენია, რამდენი დრო, ენერგია, ძალისხმევა და ცოდნა სჭირდება ამ პატარა სიტყვის მნიშვნელობის გააზრებას, დაცვას თუ მის მომავალზე ზრუნვას. ფაქტია, სასკოლო/სასწავლო დაწესებულებებში ენისადმი არსებული მიდგომები ძირეულად გადასაფასებელია ტექნოლოგიების ერაში და ტექნოლოგიებით დაინტერესებული ახალგაზრდობისათვის ენის ამ წახნაგით ჩვენება ენა-ლიტერატურის თუ სხვა საგნის მასწავლებლების უმთავრესი გამოწვევაა იმდენად, რამდენადაც ენას ყველა ვიყენებთ და ყველას გვეხება ის ცვლილებები, რომლებიც მასში თუ მის მიღმა ჩვენი ჩარევებით აისახება. „– რატომ და როდის დაიწყეს მეცნიერებმა ენის „შენახვაზე“ ზრუნვა? რა კეთდება დღეს და რა უნდა ვიცოდეთ, რომ ენის „მოვლის“ საერთაშორისო პროცესებს ღირსეულად ავუწყოთ ფეხი? რა ადგილი უჭირავს ენას ციფრული/დიგიტალური ჰუმანიტარიის უსასრულო სივრცეში?“… – არასრული კითხვების ჩამონათვალია, და სავსებით ბუნებრივია, ერთ დღესაც საკლასო ოთახში დაგვისვას 21-ე საუკუნის ქართველმა მოსწავლემ. მათ საპასუხოდ კი ყოველთვის მზად უნდა ვიყოთ.

მას შემდეგ, რაც 1973 წელს დაფუძნდა ლიტერატურული და ლინგვისტური კომპიუტინგის ასოციაცია – ALLC[1], ბევრი რამ შეიცვალა. კერძოდ: 1986 წელს პატრიკ კორნერმა[2] ჰუმანიტარული დისკუსიებისთვის სპეციალური ელექტრონული ჯგუფები – ListServ და Ansaxnet – შექმნა. 1987 წელს უილარდ მაკარტიმ დააფუძნა გლობალური ელექტრონული სემინარი „ჰუმანისტი“[3]. 1990 წელს ენტონი არისტარმა შექმნა ენათმეცნიერთა მთავარი ელექტრონული ფორუმი Linguist List[4]. 1986 წელს ISO-მ გამოუშვა მეტაენა SGML[5]. 1987 წელს ACH-ის, ALLC-სა და კომპიუტერული ლინგვისტიკის ასოციაციის მონაწილეობით დაიწყო ტექსტების ანოტაციის ერთიან ფორმატზე მუშაობა, რის შედეგადაც შემუშავდა ელექტრონული ტექსტების კოდირებისა და გაცვლის სისტემა TEI[6], რომლის პირველი სრული სახელმძღვანელო 1994 წელს გამოქვეყნდა[7]. მნიშვნელოვანია იმის ცოდნაც, რომ ტექსტების კორპუსში შემავალი მასალის ავტომატური დამუშავების დროს ხდება „მარკირება“ (Mark-up), რაც გულისხმობს თეგების გამოყენებას. ნებისმიერი მარკერი ტექსტის ინტერპრეტირების აქტს წარმოადგენს, ხოლო თეგები (ნიშნულები) დაერთვის სიტყვებსა და ფრაზებს. თეგირება[8] მოიცავს სამ დონეს: მორფოლოგიურ, სინტაქსურ და სემანტიკურ ანალიზს.

მალე TEI ფორმატმა და მეტაენამ გააფართოვა ტექსტის მანქანური დამუშავებისა და დიგიტალური/ციფრული რესურსების საერთაშორისო სამეცნიერო სივრცეში შეუფერხებლად მიმოქცევის შესაძლებლობები, რის გამოც ფართოდ დაინერგა მსოფლიოს ისეთ ცნობილ ციფრულ ბიბლიოთეკებში, ჰიპერმედიულ არქივებსა და მუზეუმებში, როგორებიცაა: უოლტ უიტმენის არქივი[9], დანტე გაბრიელ როსეტის არქივი[10], უილიამ ბლეიკის არქივი[11], სტენფორდის „წერილების რესპუბლიკა“[12], „ჩრდილების ხეობა“,[13]  სალემის ჯადოქართა სამსჯავრო[14], პერსევსის ციფრული ბიბლიოთეკა[15], „ამერიკის მეხსიერება“[16], პირველი ღია ინტერნეტენციკლოპედია[17], ღია ონლაინენციკლოპედია ვიკიპედია[18]. 2017 წელს ინგლისურ ვიკიპედიაში 5,701,955 სტატია იყო განთავსებული, მის ქართულ ვერსიაში – 124,062 სტატია. 2019 წელს: 5,938,146 ინგლისური სტატია, 131,875 – ქართული სტატია[19].

აქვე განსაკუთრებული პატივისცემით და მადლიერებით უნდა აღინიშნოს, რომ ქართული ვიკიპედია სწორედ ქართული სკოლის წიაღში მოხალისეობრივ საფუძველზე შეიქმნა და უსასყიდლოდ, ყოველივე ანაზღაურების გარეშე მდიდრდება. მისი ავტორი და ერთ-ერთი შემოქმედია ექვთიმე თაყაიშვილის სახელობის დაბა სურამის N2 საჯარო სკოლის ისტორიის მასწავლებელი, ჯაბა ლაბაძე. ამჟამად ქართულ ვიკიპედიას ჰყავს 3 ადმინისტრატორი, 30-მდე შემმოწმებელი და, სულ ბოლო მონაცემით,  წარმოდგენილია 132 241 ქართული სტატია, რომელთა უმრავლესობა სწორედ ჯაბასა და მის მოწაფეებზე მოდის, განსაკუთრებით აღნიშვნას საჭიროებს ასევე ის ფაქტი, რომ მათი ძალისხმევით მომზადდა და ვიკიპედიაში განთავსდა სტატიები კულტურული მემკვიდრეობის ძეგლების შესახებ, მათ შორის, აფხაზეთში არსებული ძეგლების შესახებ ქართულად, ინგლისურად და აფხაზურად (აფხაზური ვიკიპედიისთვის),  სამაჩაბლოს შესახებ კი – ჯერჯერობით მხოლოდ ქართულად.

2008 წლიდან ციფრული მეტაფორების – „დიდი ნავთობი“, „დიდი წიაღისეული“ – გვერდით გაჩნდა ტერმინი „დიდი მონაცემები“, რომელიც პირველად 2008 წელს ამერიკის ქსელური ინფორმაციის კოალიციის დირექტორმა – კლიფორდ ლინჩმა გამოიყენა. დიდ მონაცემებს ხუთი მთავარი ნიშან-თვისების მიხედვით ახასიათებენ. ესენია: – მოცულობა, (volume),  ზრდის, დამუშავების, შედეგების მიღების სიჩქარე (velocity), მრავალფეროვნება (variety), უტყუარობა (veracity), ცვალებადობა (variability). ამ პრინციპებით Google Book Search-ისა და Google Books-ის პროექტის ფარგლებში სკანირებული (გაციფრებული) წიგნების რიცხვი უკვე 25 მილიონს აღემატება[20].

იმდენად, რამდენადაც მატერიალური და სულიერი მემკვიდრეობის დიგიტალური დოკუმენტირება და არქივირება კულტურული მემკვიდრეობის კვლევის აუცილებელ წინაპირობას წარმოადგენს, დღის წესრიგში დადგა საფრთხეში მყოფი ენების დოკუმენტირების საკითხი. დიგიტალური/ციფრული ჰუმანიტარიის განვითარებისა და ენათა და კულტურათა ელექტრონული დოკუმენტირების საშუალებების გაჩენის წყალობით  დოკუმენტირება დღეს უკვე აღარ გაიგება, როგორც მასალის უბრალო ჩაწერა-ფიქსაცია. ამ ცნებამ უფრო ფართო და მრავალწახნაგოვანი შინაარსი შეიძინა – XXI საუკუნის გამოწვევების ფონზე ხელახლა დამუშავდა დოკუმენტირების ძირითადი პრინციპები და მეთოდები, რამაც საფუძველი დაუდო ენებისა და კულტურების დოკუმენტირების თვისობრივად ახალ ეტაპს – დიგიტალურ დოკუმენტირებასა და არქივირებას. 2000 წლიდან ხორციელდება ტეხასის უნივერსიტეტის პროექტი AILLA[21] – „ინდიგენური ენები ლათინურ ამერიკაში“[22], 2002 წელს საფრთხეში მყოფი ენების დოკუმენტირების პროგრამა ELDP[23] ამოქმედდა ლონდონში – SOAS-ის უნივერსიტეტში[24]. 2003 წელს UNESCO-მ სპეციალური დოკუმენტი მიუძღვნა ენების საფრთხის პრობლემას, ასევე ამოქმედდა ლოკალური პროგრამები: DELAMAN, CLARIN და სხვა.

სწორედ ამ გამოწვევების კვალდაკვალ შეიქმნა ჰუმანიტარულ მეცნიერებაში კიდევ ერთი ინტერდისციპლინური მიმართულება  – დიგიტალური დოკუმენტირებისა და არქივირების შემსწავლელი დარგი – დოკულინგვისტიკა, რომლის კვლევის ობიექტია ენა, მისი ლინგვისტური, ლინგვოკულტუროლოგიური, ქრონოტოპული თუ სოციალური ასპექტებით. ცდოკულინგვისტიკის ფუძემდებლის, ნ. ჰიმელმანის თანახმად, ენის დოკუმენტირება ნიშნავს ენობრივ მონაცემთა თანმიმდევრულ და მრავალმიზნობრივ (ინტერდისციპლინური კვლევებისთვის გათვლილ) შეგროვება-დაფიქსირებას, მოპოვებული რესურსების ტექნოლოგიურ დამუშავებასა და მათ არქივირებას.

სწორედ ამ მიდგომების გათვალისწინებით, მეცნიერების განვითარების ფონდის – Volkswagen Stiftung ინიციატივით შეიქმნა მდგრადი განვითარების სამეცნიერო-კვლევითი პროგრამა (1999-2011) DOBES (Dokumantation der Bedroten Sprachen), რომელიც მიზნად ისახავდა მსოფლიოს ხუთივე კონტინენტზე საფრთხეში მყოფი ენების შერჩევას, დოკუმენტირებასა და არქივირებას  შესაძლო რევიტალიზაციის მიზნით.  პროგრამის ფარგლებში სულ 67 სამეცნიერო პროექტი განხორციელდა მსოფლიოს ხუთივე კონტინენტზე, რომელთა კვლევის შედეგად დამუშავდა დიგიტალური დოკუმენტირებისა და არქივირების დღეისათვის მოქმედი საერთაშორისო სტანდარტი. პროგრამის ფარგლებში დამუშავდა ენებისა და კულტურების დოკუმენტირების ახალი სტრატეგია, შემუშავდა ძირითადი პრინციპები და მეთოდოლოგია და, რაც მთავარია, შეიქმნა დიგიტალური რესურსების დამუშავებისა და არქივირების ტექნოლოგიური ინსტრუმენტები და ენათა არქივი TLA (The Language Archive), სადაც თავმოყრილია DOBES-ის ფარგლებში მოპოვებული მასალები.

ენათა და დიალექტების გაქრობის საშიშროების გაცნობიერებამ ცხადი გახადა, რომ ენის გაქრობასთან ერთად ქრება ამ ენის მატარებელი სოციუმის კულტურული მემკვიდრეობა და სოციუმის შემოქმედებითი პოტენციალის რეალიზების შესაძლებლობა. ენის მეშვეობით დოკუმენტირებული რესურსები კი საშუალებას გვაძლევს, თვალი მივადევნოთ არა მარტო ენების სტრუქტურულ განვითარებას, არამედ ამ ენათა მატარებელი ხალხების ისტორიულ და კულტურულ ევოლუციას. აქედან გამომდინარე, ენის დოკუმენტირება კულტურის დოკუმენტირების ტოლფასად აღიქმება და არსებითი მნიშვნელობისაა არა მხოლოდ კაცობრიობის განვითარების დიაქრონიული კვლევის თვალსაზრისით, არამედ სინქრონიულადაც, რათა გამოვიკვლიოთ ენობრივი ქცევის ნორმები, მოვახდინოთ ენობრივი სიტუაციიდან გამომდინარე ეთნიკური და პოლიტიკური კონფლიქტების პროგნოზირება და სწორად დავგეგმოთ და განვახორციელოთ ენობრივი პოლიტიკა“, – აცხადებს ფრანკფურტის გოეთეს უნვერსიტეტის კავკასიოლოგიური ცენტრის ხელმძღვანელი, პროფესორი მანანა თანდაშვილი. მისივე თქმით, ენებისა და კულტურების დოკუმენტირება განსაკუთრებულ მნიშვნელობას  იძენს დღესდღეობით ენათა გაქრობის საშიშროების ფონზე. რამდენადაც გლობალიზაციის პროცესმა მნიშვნელოვნად დააჩქარა მსოფლიოს ლინგვისტურ რუკაზე ენათა გაქრობის პროცესი: იუნესკო-ი მონაცემებით, დღეისათვის 7000-მდე ენა არსებობს (36 იზოლირებული ენა, 82 – კრეოლი და 119 – ჟესტების ენა, დანარჩენი ენები 150-მდე ენათა ოჯახში არის გადანაწილებული), რომელთაგან თითქმის ნახევარს გაქრობის საშიშროება ემუქრება. გაქრობის საფრთხის წინაშე მდგარი ენების მსოფლიო ატლასში  დღეისათვის 2465 ენაა რეგისტრირებული, მათ შორის საქართველოში გავრცელებული ენებიდან 11 ენა: უდიური, წოვა-თუშური, პონტოელ ბერძენთა მეტყველება, ახალ-არამეული, ლაზური და სხვ.

საკუთრივ ქართული ენისა და მისი დიალექტების დოკუმენტირების მიზნით კი დღესდღეობით ენათმეცნიერთა ჯგუფები აქტიურად მუშაობენ როგორც საქართველოში, ასე მის საზღვრებს გარეთ. მათ შესახებ კი ვრცლად სხვა წერილებში მოგიყვებით.

 

 

გამოყენებული რესურსები:

  1. http://tandaschwili.com/
  2. Himmelmann, Documentary and descriptive linguistics, Linguistics 36 (1998). 161-195.

SOAS: Whatisit – http://www.hrelp.org/documentation/whatisit/

  1. Gippert, Jost, Nikolaus P. Himmelmann, Ulrike Mosel http://emilkirkegaard.dk/lyddansk/sites/default/files/files/essentials-of-language-documentation.pdf
  2. DocumentaryLinguistics https://www.google.de/search?tbm=bks&q=%22documentary+linguistics&cad=h
  3. Bibliographie: http://www.oxfordbibliographies.com/view/document/obo-9780199772810/obo-9780199772810-0075.xml

 

 

[1] The Association for Literary and Linguistic Computing

[2] Patrick W. Conner

[3] http://dhhumanist.org/

[4] https://www.linguistlist.org/

[5] Standard Generalized Markup Language — სტანდარტული განზოგადებული მარკირების ენა

[6] Text Encoding Initiative

[7] http://www.tei-c.org/index.xml

[8] თეგების გარშემომრტყმელ სიმბოლოებს (<>)კუთხური ფრჩხილები ეწოდება. თეგები წარმოადგენს წყვილს, მაგალითად, და . წყვილის პირველი თეგი არის საწყისი თეგი, ხოლო მეორე – სასრული თეგი. საწყის და სასრულ თეგებს შორის მოთავსებულ ტექსტს ეწოდება ელემენტის შიგთავსი.

[9] http://whitmanarchive.org

[10] http://www.rossettiarchive.org/

[11] http://www.blakearchive.org/

[12] http://republicofletters.stanford.edu/

[13] http://valley.lib.virginia.edu/

[14] http://salem.lib.virginia.edu/

[15] http://www.perseus.tufts.edu/

[16] The Stanford Encyclopedia of Philosophy (https://plato.stanford.edu/)

[17] The Stanford Encyclopedia of Philosophy (https://plato.stanford.edu/)

[18] https://www.wikipedia.org/

[19]https://en.wikipedia.org/wiki/Special:Statistics აღნიშნული მასალის მომზადებისას ვეყრდნობით პროფ. რამაზ ხალვაშის მონაცემს, რომელიც ბათუმის სახელმწიფო უნივერსიტეტში 2019 წლის ოქტომბერში გამართულ დიგიტალური ქართველოლოგიის საერთაშორისო ვორქშოფზე წარმოადგინა.

[20] https://books.google.com/

[21] the Archive of the Indigenous Languages of Latin America

[22] http://www.ailla.utexas.org/

[23] Endangered Languages Documentation Programme

[24] http://www.eldp.net/

კომენტარები

comments