บ้าน / อาบน้ำ / โมดูลภาษาสากล ใช้การสอนภาษาต่างประเทศแบบแยกส่วนเพื่อพัฒนาความเป็นอิสระของนักเรียน วิธีเปิดการเข้าถึงร้านค้าซื้อขาย

โมดูลภาษาสากล ใช้การสอนภาษาต่างประเทศแบบแยกส่วนเพื่อพัฒนาความเป็นอิสระของนักเรียน วิธีเปิดการเข้าถึงร้านค้าซื้อขาย

ชอบเว็บไซต์ของเรา? การรีโพสต์และการให้คะแนนของคุณถือเป็นคำชมที่ดีที่สุดสำหรับเรา!

อาคารกองทหารรักษาการณ์ขนาดกลางที่ให้คุณแลกเปลี่ยนรีเอเจนต์การประดิษฐ์เป็นทรัพยากรกองทหารรักษาการณ์และในทางกลับกัน นอกจากนี้ยังเปิดการเข้าถึงกลุ่ม (Alliance) และ (Horde) ให้คุณใช้การประมูล

เราแนะนำให้ใช้ส่วนเสริม แผนแม่บท- นี่คือส่วนเสริมที่ดีที่สุดสำหรับการจัดการกองทหารบน ช่วงเวลานี้. สามารถค้นหาและดาวน์โหลดส่วนเสริมได้ เพื่อความสะดวกในการจัดการภารกิจ เราขอแนะนำให้ใช้ส่วนเสริม ผู้จัดการภารกิจกองพัน. คุณสามารถค้นหาและดาวน์โหลดได้

1. ภาพรวม

2. จะเปิดเข้าสู่ร้านค้าซื้อขายได้อย่างไร?

ในส่วนนี้ เราจะบอกคุณถึงวิธีเข้าถึงร้านค้าระดับ 1, 2 และ 3

2.1. Trading Post ระดับ 1

ร้านค้าระดับแรกจะสามารถใช้ได้ทันทีหลังจากการก่อสร้างศาลากลางจังหวัด

2.2. Garrison Blueprint: Trading Post ระดับ 2

Garrison Blueprint: Trading Post ระดับ 2 สามารถซื้อได้ที่ระดับ 98 หรือหลังจากสร้างด่านหน้าใน Spiers of Arak มีค่าใช้จ่าย 1,000 กรัมหรือแลกเปลี่ยนเป็นบันทึกการจัดตั้งด่านหน้า สามารถรับโน้ตได้สองครั้ง: ครั้งแรก - ระหว่างเควสใน Gorgrond ครั้งที่สอง - ระหว่างเควสใน Spiers of Arak ซึ่งช่วยประหยัดทองได้บ้าง ด้านล่างนี้คือที่ตั้งของพ่อค้าสำหรับ Horde และ Alliance

2.3. Garrison Blueprint: Trading Post ระดับ 3

Garrison Blueprint: Trading Post ระดับ 3 เป็นรางวัลจากความสำเร็จของ Savage Friends (Alliance) หรือ Savage Friends (Horde) ที่มี 3 จาก 5 ฝ่าย Draenor: (Alliance), (Horde), (Alliance), (Horde) , (พันธมิตร), (ฮอร์ด). ความสำเร็จจะถูกแบ่งปันโดยตัวละครทั้งหมดในบัญชี

หลังจากเสร็จสิ้นความสำเร็จ คุณไม่ควรหวังว่าพิมพ์เขียวจะปรากฏในกระเป๋าของคุณอย่างน่าอัศจรรย์ ไปที่ Spartz Boltwhack (Alliance) หรือ Rezlak (Horde) และซื้อในราคา 1000g

3. แลกเปลี่ยน

เมื่อมาที่ร้านครั้งแรกจะได้รับเควส (Alliance) หรือ A Little Tricks (Horde) หลังจากทำภารกิจเสร็จสิ้น คุณจะสามารถเข้าถึงร้านค้าได้ เขาขายน้ำยาสำหรับสร้าง Draenor: แร่ หญ้า เนื้อสัตว์ เนื้อปลา ขนสัตว์ หนัง และผงวิเศษ ราคา 5 ยูนิต รีเอเจนต์มีตั้งแต่ 20 ถึง 50x Garrison Resources (ราคาจะแตกต่างกันเสมอสำหรับ Horde และ Alliance)

4. คำสั่งซื้อ

คำสั่งรายวันใน Trading Post อนุญาตให้คุณแลกเปลี่ยนรีเอเจนต์สำหรับทรัพยากร Garrison อัตราแลกเปลี่ยน - 5 รีเอเจนต์สำหรับ 20 ทรัพยากร

5. การประมูล

เมื่อเยี่ยมชมร้านค้าระดับที่สองเป็นครั้งแรก คุณสามารถทำภารกิจจากกลไกการค้าแบบโบราณ: (พันธมิตร) หรือ (กลุ่ม) คุณจะได้รับ 5 ส่วน โดยแต่ละส่วนจะต้องรวมกับรายการที่แตกต่างกัน:

  • โมดูล Arcane Crystal ต้องการ 4 reagents ซึ่งสามารถรับได้จาก mobs และบอสในการบุกหรือโจมตีกองทหาร:
  • โมดูลการจัดการการประมูลต้องใช้รีเอเจนต์ 3 ตัว ซึ่งสามารถรับได้จาก mobs และบอสในดันเจี้ยน:

หนึ่งในเทคโนโลยีสมัยใหม่ที่ช่วยแก้ปัญหาในการเปลี่ยนกระบวนทัศน์ของการศึกษาคือการศึกษาแบบแยกส่วน เพราะมันขึ้นอยู่กับตำแหน่งของแนวทางที่คล่องแคล่วว่องไวและยืดหยุ่นเพื่อสร้างกระบวนการสอน

ในช่วงปลายยุค 80 - ต้นยุค 90 ของศตวรรษที่ XX คำศัพท์ใหม่จากสาขาวิทยาศาสตร์เทคนิค "แตก" เป็นวิทยาศาสตร์การสอนคือ "โมดูล" โมดูล (จาก ลท. โมดูลัส-"วัดเล็ก ๆ " - ส่วนประกอบแยกออกได้หรืออย่างน้อยก็แตกต่างทางจิตใจจากคนทั่วไป โมดูลาร์ มักเรียกว่าสิ่งที่ประกอบด้วยส่วนต่างๆ ที่กำหนดไว้อย่างชัดเจน ซึ่งมักจะเอาออกหรือเพิ่มเติมได้โดยไม่ทำลายของส่วนรวม

มีการเขียนและพูดคุยกันมากมายเกี่ยวกับประโยชน์ของการเรียนรู้แบบแยกส่วนในระบบการศึกษา การเรียนรู้แบบแยกส่วน - วิธีการจัดกระบวนการศึกษาตามการนำเสนอข้อมูลทางการศึกษาแบบแยกส่วน

สาระสำคัญของการฝึกอบรมแบบแยกส่วนคือเนื้อหาของการฝึกอบรมมีโครงสร้างเป็นบล็อกขององค์กรและระเบียบวิธีอิสระ - โมดูล เนื้อหาและปริมาณอาจแตกต่างกันไปขึ้นอยู่กับเป้าหมายการสอน โปรไฟล์ และความแตกต่างระดับของนักเรียน ความต้องการของนักเรียนที่จะเลือก วิถีการเคลื่อนที่ของแต่ละคนตลอดหลักสูตรการฝึกอบรม โมดูลสามารถบังคับและเลือกได้ ตัวโมดูลเองถูกสร้างขึ้น: เป็นหน่วยโครงสร้างของหลักสูตรในแบบพิเศษ; เป็นโครงสร้างสหวิทยาการขององค์กรและระเบียบวิธี ในรูปแบบของชุดของส่วนต่างๆ จากสาขาวิชาต่างๆ รวมกันเป็นหนึ่งโดยพื้นฐานเฉพาะเรื่อง หรือเป็นหน่วยโครงสร้างองค์กรและระเบียบวิธีภายในกรอบของวินัยวิชาการ องค์ประกอบที่จำเป็นของการฝึกอบรมแบบแยกส่วนมักจะเป็นระบบการให้คะแนนสำหรับการประเมินความรู้ ซึ่งเกี่ยวข้องกับการให้คะแนนความก้าวหน้าของนักเรียนตามผลการเรียนแต่ละโมดูล

ในสาขาวิทยาศาสตร์การสอน โมดูลนี้ถือเป็นส่วนสำคัญของทั้งระบบโดยไม่ทราบว่าระบบการสอนไม่ทำงาน ในแง่ของเนื้อหา มันเป็นบล็อกที่สมบูรณ์และมีเหตุผล

การศึกษาแบบแยกส่วนซึ่งใช้บางส่วนในโรงเรียนในอังกฤษและสวีเดน สร้างขึ้นตามกฎของโมดูล เมื่อการออกแบบสื่อการสอนทำให้แน่ใจว่านักเรียนแต่ละคนบรรลุงานการสอนที่กำหนดไว้ มีความครบถ้วนของเนื้อหาในโมดูลและการบูรณาการ ประเภทต่างๆและรูปแบบการศึกษา ผลในเชิงบวกที่ได้รับจากการฝึกอบรมดังกล่าวเกี่ยวข้องกับพลวัตซึ่งประกอบด้วยความแปรปรวนของเนื้อหาขององค์ประกอบและโมดูล เป้าหมายของการฝึกอบรมนี้กำหนดขึ้นในแง่ของวิธีการของกิจกรรมและรูปแบบการดำเนินการ แบ่งออกเป็นวัฏจักรของความรู้ความเข้าใจและวัฏจักรของกิจกรรมประเภทอื่น การเรียนรู้แบบแยกส่วนมีความโดดเด่นด้วยวิธีการที่มีปัญหาทัศนคติที่สร้างสรรค์ของนักเรียนต่อการเรียนรู้ ความยืดหยุ่นนั้นสัมพันธ์กับการสร้างความแตกต่างและการทำให้การฝึกอบรมเป็นรายบุคคลโดยอิงจากการวินิจฉัยซ้ำๆ หลายครั้ง เพื่อกำหนดระดับความรู้ ความต้องการ และฝีเท้าของแต่ละคน กิจกรรมการเรียนรู้ผู้เรียน

หลักการชี้นำของการเรียนรู้แบบแยกส่วน ได้แก่ :

  • 1) หลักการของโมดูลาร์
  • 2) จัดโครงสร้างเนื้อหาของการฝึกอบรมออกเป็นองค์ประกอบที่แยกจากกัน
  • 3) พลวัต;
  • 4) กิจกรรม;
  • 5) ความยืดหยุ่น;
  • 6) มุมมองอย่างมีสติ;
  • 7) ความเก่งกาจของคำแนะนำระเบียบวิธีและความเท่าเทียมกัน

หลักการของโมดูลาร์ประกอบด้วยความสมบูรณ์และครบถ้วน ความสมบูรณ์ และความสอดคล้องของหน่วยการสร้างของสื่อการเรียนการสอนในรูปแบบของโมดูลบล็อกภายในซึ่งสื่อการเรียนการสอนมีโครงสร้างในรูปแบบของระบบองค์ประกอบทางการศึกษา จากบล็อกโมดูลจากองค์ประกอบหลักสูตรการฝึกอบรมเกี่ยวกับเรื่องจะถูกสร้างขึ้น องค์ประกอบภายในโมดูลบล็อกสามารถใช้แทนกันได้และเคลื่อนย้ายได้ การพัฒนาสื่อการเรียนการสอนเกิดขึ้นในกระบวนการของกิจกรรมการศึกษาที่สมบูรณ์

เป็นโมดูลที่สามารถทำหน้าที่เป็นโปรแกรมการฝึกอบรม เนื้อหา วิธีการสอน ระดับความเป็นอิสระ ก้าวของกิจกรรมการศึกษาและความรู้ความเข้าใจของนักเรียน ลักษณะสำคัญของการเรียนรู้แบบแยกส่วนคือความแตกต่างจากระบบการเรียนรู้อื่นๆ

ประการแรกเนื้อหาของการฝึกอบรมถูกนำเสนอในคอมเพล็กซ์อิสระที่สมบูรณ์ (บล็อกข้อมูล) การดูดซึมจะดำเนินการตามเป้าหมาย เป้าหมายการสอนถูกสร้างขึ้นสำหรับนักเรียนและไม่เพียง แต่บ่งบอกถึงปริมาณของเนื้อหาที่ศึกษาเท่านั้น แต่ยังรวมถึงระดับการดูดซึมด้วย นอกจากนี้ นักเรียนแต่ละคนยังได้รับคำแนะนำเป็นลายลักษณ์อักษรจากครูเกี่ยวกับวิธีการปฏิบัติอย่างมีเหตุผลมากขึ้น จะหาสื่อการศึกษาที่จำเป็นได้ที่ไหน

ประการที่สอง รูปแบบการสื่อสารระหว่างครูและนักเรียนกำลังเปลี่ยนไป มันดำเนินการผ่านโมดูลและรวมถึงการสื่อสารส่วนบุคคลส่วนบุคคล เป็นโมดูลที่ทำให้สามารถถ่ายทอดการเรียนรู้ไปยังรายวิชาได้ - พื้นฐานส่วนตัว ความสัมพันธ์กลายเป็นความเท่าเทียมกันระหว่างครูและนักเรียน

ประการที่สาม นักเรียนใช้เวลาอย่างเต็มที่โดยอิสระ เรียนรู้การกำหนดเป้าหมาย การวางแผนตนเอง การจัดการตนเอง การควบคุมตนเอง และความภาคภูมิใจในตนเอง

Yu.B. Kuzmenkova กำหนดโมดูลเป็นหลักสูตรย่อยในตัวเองและถือว่าหลักสูตรนี้ (เช่นเดียวกับหลักสูตรอื่น ๆ ) ได้รับการออกแบบตามเป้าหมายที่กำหนด วิธีการดำเนินการและการตรวจสอบผลสำเร็จ ตามที่ Yu.B. Kuzmenkova จำเป็นต้องกำหนดจำนวนงานที่จำกัดซึ่งเป็นไปได้ตามความเป็นจริงในระยะเวลาการศึกษาที่จำกัด ในการทำเช่นนี้ เป็นการสะดวกที่จะเขียนโมดูลระยะสั้นและแบบหมุนหลายโมดูลตามส่วนประกอบหลัก (สำหรับโปรแกรมใด ๆ ) ที่ระบุไว้ - การวางแนวเฉพาะเรื่องและการวางแนวเป้าหมาย - และภายในกรอบ หลักสูตรทั่วไปเรียงเป็นอนุกรมและ/หรือขนานกัน คุณลักษณะประการหนึ่งของแนวทางที่เสนอคือความเป็นไปได้ของการสร้างความแตกต่าง ซึ่งทำให้สามารถแยกแยะความแตกต่างระหว่างการตั้งค่าเป้าหมายที่เลือกได้อย่างชัดเจน ในเวลาเดียวกัน เป็นการสะดวกมากที่จะแบ่งโมดูลออกเป็นโมดูลภาษาและคำพูด ความแตกต่างนี้ขึ้นอยู่กับหลักการของการมุ่งเน้นความสนใจตามที่การพัฒนาสื่อการศึกษาโดยเฉพาะอย่างยิ่งที่ไม่คุ้นเคยจะมีประสิทธิภาพมากขึ้นเมื่อแยกแยะปัญหาและลบออกทีละรายการ (11, 21-28)

ตามนี้ เมื่อรวบรวมโมดูลภาษา ควรเน้นที่การพัฒนาหัวข้อเฉพาะ (หรือลำดับหัวข้อเฉพาะ) ที่เกี่ยวข้องกับการศึกษาแง่มุมของภาษา - ตัวอย่างเช่น จากหมวดสัทศาสตร์ที่เกี่ยวข้อง ไวยากรณ์หรือคำศัพท์ ในขณะที่รวบรวมโมดูลคำพูดถือว่างานหลักคือการฝึกฝนทักษะและความสามารถใด ๆ ภายในกรอบของ RD ประเภทหนึ่ง (หรือสองประเภทที่เกี่ยวข้อง - การเปิดกว้างและการสืบพันธุ์)

การศึกษาสมัยใหม่เกี่ยวกับหลักการโมดูลาร์ของการจัดกระบวนการศึกษา แยกแยะสามช่วงตึกหลักในโครงสร้างของโมดูล: บล็อกที่มีเนื้อหาที่จะศึกษา ภาคปฏิบัติ และกลุ่มควบคุม

แอล.เอ็น. และฉัน. Kuznetsovs เสนอโครงสร้างโมดูลต่อไปนี้:

บล็อกเป้าหมาย (เป้าหมายการสอนของโมดูล งานที่เน้นบุคลิกภาพที่บรรลุเป้าหมาย)

อัพเดทบล็อค (รายการความรู้พื้นฐานและวิธีการดำเนินการที่จำเป็นในการศึกษาหัวข้อ แบบฝึกหัด แบบทดสอบ และอื่นๆ) งานอิสระสำหรับการอัพเดท

ความรู้พื้นฐาน).

บล็อคปัญหา (สถานการณ์ปัญหาที่มีความสำคัญส่วนตัวสำหรับนักเรียน เนื้อหาที่เต็มไปด้วยอารมณ์ในหัวข้อ)

บล็อกกองทุน (อุปกรณ์และสื่อการสอน (ปรับปรุงอย่างต่อเนื่อง) พบระเบียบวิธีวิจัย)

บล็อกเชิงทฤษฎี (รายการความรู้เรื่องและวิธีการดำเนินการ, การจัดระบบความคิด, หลักการ, รูปแบบ, วิธีการ, วิธีการทั่วไปของการกระทำ, การนำเสนอเนื้อหาและโครงสร้างของหัวข้อในรูปแบบของการสนับสนุน (การวางแนวในหัวข้อ)

บล็อกแอปพลิเคชัน (ระบบงานหลายระดับสำหรับการทำซ้ำและการรวมตัวแปร)

บล็อกลักษณะทั่วไป (สื่อการสอนสำหรับการสรุปโดยย่อ, การจัดระบบของสื่อการศึกษา, การไตร่ตรอง)

บล็อกช่อง (สื่อการฝึกอบรมที่มีความซับซ้อนเพิ่มขึ้น)

บล็อก "ทางออก" (สื่อการสอนสำหรับ งานควบคุม, การทดสอบ, รายงานการประชุมทางการศึกษา, การบ้าน).

ตารางที่ 2. การสร้างโมดูลภาษาที่เป็นไปได้

งานฝึกอบรมอาจรวมถึงการพัฒนาทักษะและความสามารถที่ซับซ้อน และเมื่อทำงานในหัวข้อที่เลือก คุณสามารถใช้ ประเภทต่างๆการอ่าน / การฟัง การแสดงบทบาทสมมติ การนำเสนอ การเขียนรายงาน การเขียนเรียงความ ฯลฯ - แต่ไม่ล้มเหลวโดยเน้นที่การพัฒนาทักษะด้านคำศัพท์เป็นหลัก คำศัพท์ (ในปริมาณที่ควบคุมโดยพจนานุกรมขั้นต่ำ) ถูกดูดซึมได้ดีในการพัฒนาทักษะการสื่อสารในสาขาที่เลือก - ในสถานการณ์การสื่อสารตามเงื่อนไขประเภทต่างๆ

อย่างไรก็ตาม หากนักเรียนไม่มีเวลาเพียงพอในหลักสูตรพื้นฐานเพื่อศึกษาหัวข้อเฉพาะของสัทศาสตร์หรือไวยากรณ์ ก็สามารถสร้างโมดูลที่เน้นการเรียนรู้ทักษะที่จำเป็นในหัวข้อแคบๆ ในทำนองเดียวกัน ตัวอย่างเช่น "การแก้ไขการออกเสียงสระภาษาเยอรมัน" หรือ "การแก้ไขการใช้รูปแบบกริยาตึงเครียด" (ในกรณีหลัง ตัวอย่างที่ดีคือการถ่ายทอดการเน้นย้ำจากการฝึกหัดไปเรียนไวยากรณ์ในบริบท) ในขณะเดียวกัน ก็เป็นไปได้ที่จะพัฒนาทักษะการพูดอย่างครอบคลุมโดยอาศัยคำศัพท์ที่เป็นที่รู้จักอยู่แล้ว อย่างไรก็ตาม ลำดับความสำคัญจะเน้นการทำงานกับเนื้อหาเกี่ยวกับไวยากรณ์หรือสัทศาสตร์

เป็นไปได้ที่จะเขียนโมดูลเฉพาะเรื่องต่างๆ โดยเลือกการตั้งค่าเป้าหมายตามตารางที่ 3 ดังนี้

ตารางที่ 3 การพัฒนาความรู้ที่จำเป็นในด้านภาษา

ควรสังเกตว่าระยะเวลาและความถี่ของหลักสูตรย่อยเป็นตัวแปร และโมดูลไม่จำเป็นต้องเป็นบทเรียนทั้งหมด อาจครึ่งบทเรียนหรือบางส่วน หรือชุดของบทเรียนที่จัดตามหัวข้อที่มีระยะเวลานานกว่า เมื่อทำการคอมไพล์โปรแกรม สามารถปรับเปลี่ยนและนำไปใช้ใน ชุดค่าผสมที่แตกต่างกัน: โมดูลภาษาที่แตกต่างกันสองโมดูลภายในโปรแกรมของวิชาเลือกสามารถขยายได้ตลอดทั้งไตรมาสแรก และเรียงต่อกันในบทเรียนเดียว (10 นาที - การออกเสียง เวลาที่เหลือเป็นไวยากรณ์) และโมดูลคำศัพท์สามารถเริ่มจาก ไตรมาสที่สองหรืออย่างอื่น ทางเลือกและลำดับของการแนะนำโมดูลจะพิจารณาจากความต้องการเฉพาะของนักเรียน เป็นสิ่งสำคัญที่จากมุมมองของการวางแผนข้อกำหนดหลักคือแนวทางที่เป็นระบบในการจัดระเบียบชั้นเรียน (วัฏจักรความต่อเนื่องการทำซ้ำและตามการรายงานปกติ) ไม่เช่นนั้นนวัตกรรมแบบแยกส่วนทั้งหมดจะกลายเป็นเรื่องวุ่นวาย .

การพัฒนาโมดูลสำหรับการสอนไวยากรณ์จะสะดวกที่สุดเพราะ ไวยากรณ์ที่ก่อให้เกิดความยุ่งยากในการเรียนรู้มากที่สุดก็เพราะความไม่รู้ไวยากรณ์ที่นักเรียนทำผิดพลาดมากมายในช่องปากและ การเขียนดังนั้น มาดูแง่มุมของภาษานี้อย่างละเอียดยิ่งขึ้น

ไวยากรณ์คือชุดของกฎเกณฑ์เกี่ยวกับการเปลี่ยนคำและการรวมคำในประโยค ทำให้สามารถใส่ความคิดของมนุษย์ไว้ในเปลือกภาษาวัสดุได้ ไวยากรณ์ไม่สามารถแยกออกจากคำพูดได้ หากปราศจากไวยากรณ์ การเรียนรู้รูปแบบการพูดใดๆ ก็เป็นไปไม่ได้ เนื่องจากมันควบคู่ไปกับคำศัพท์และองค์ประกอบเสียงเป็นพื้นฐานของคำพูด ลักษณะเฉพาะไวยากรณ์คือ การแยกจากเฉพาะและเป็นรูปธรรม ต้องใช้คำทั่วไปที่รองรับการเปลี่ยนแปลงคำและการรวมคำในประโยค และสร้างกฎไวยากรณ์จากนั้น

จากที่กล่าวมาข้างต้น ไวยากรณ์มีความสำคัญในทางปฏิบัติอย่างยิ่ง ดังนั้นในการทดลองที่กำลังดำเนินการอยู่ จะพิจารณาโมดูลสำหรับการสอนไวยากรณ์

ดังนั้น การใช้โมดูลต่างๆ จึงสามารถดำเนินการสื่อสารภายในวิชาและระหว่างวิชาได้สำเร็จ ผสานรวมเนื้อหาทางการศึกษา ขึ้นรูปในตรรกะของเนื้อหาของวิชาทางวิชาการชั้นนำ โดยจำเป็นต้องแยกความแตกต่างของเนื้อหาทางการศึกษา

ETAP-3 เป็นระบบประมวลผลข้อความแบบมัลติฟังก์ชั่นสำหรับ ภาษาธรรมชาติซึ่งได้รับการพัฒนามาตั้งแต่ปี 1980 กลุ่มนักภาษาศาสตร์ นักคณิตศาสตร์ และโปรแกรมเมอร์ชาวรัสเซียที่ Institute for Information Transmission Problems of the Russian Academy of Sciences ระบบ ETAP-3 มีพื้นฐานมาจากทฤษฎี “ความหมาย Û ข้อความ” ซึ่งพัฒนาโดย I.A. Melchuk และทฤษฎีปริพันธ์ของภาษาที่พัฒนาโดย Yu.D. อาเพรเซียน.

STAGE-3 ไม่ใช่การพัฒนาเชิงพาณิชย์ที่มุ่งบรรลุเป้าหมายการใช้งานเฉพาะ งานหลักของเราคือการสร้างแบบจำลองทางภาษาของภาษาธรรมชาติและการใช้คอมพิวเตอร์ของแบบจำลองดังกล่าว สิ่งนี้อธิบายความปรารถนาของเราที่จะสร้างแบบจำลองที่เพียงพอที่สุดจากมุมมองทางภาษาศาสตร์ บ่อยครั้งที่ข้อมูลภาษาศาสตร์จำนวนมากถูกป้อนเข้าสู่ระบบ โดยไม่คำนึงว่าจำเป็นต้องปรับปรุงประสิทธิภาพของการประมวลผลข้อความของคอมพิวเตอร์หรือไม่ โดยเฉพาะอย่างยิ่ง เราพยายามเพื่อให้ได้โครงสร้างวากยสัมพันธ์ที่ถูกต้องทางภาษาสำหรับแต่ละประโยค ไม่ใช่เพราะไม่เช่นนั้น ประโยคนั้นจะไม่ถูกแปลเป็นภาษาอื่นอย่างถูกต้อง ตัวอย่างเช่น เนื่องจากสิ่งนี้จำเป็นสำหรับงานสร้างแบบจำลองไวยากรณ์ภาษาธรรมชาติ อย่างไรก็ตาม เราเชื่อมั่นว่าในการวิเคราะห์ขั้นสุดท้าย ความเพียงพอทางทฤษฎีและความครบถ้วนสมบูรณ์ของข้อมูลทางภาษาศาสตร์ได้รับผลตอบแทนจากมุมมองเชิงปฏิบัติอย่างแท้จริง

แอปพลิเคชัน STAGE-3 ทั้งหมดใช้ระบบลอจิก 3 ค่าดั้งเดิมและ FORET ภาษาคำอธิบายที่เป็นทางการโดยละเอียด (ดู Apresyan et al. 1992a, Apresjan et al. 1992b)

2. Stage-3: โมดูล คุณสมบัติ สถาปัตยกรรม การนำไปใช้

2.1.โมดูล

ระบบ ETAP-3 ประกอบด้วยโมดูลหลักดังต่อไปนี้:

  • ระบบแปลภาษาด้วยเครื่องคุณภาพสูง
  • โมดูลสำหรับสร้างข้อความภาษารัสเซียตาม Universal Network Language (UNL)
  • อินเทอร์เฟซภาษาธรรมชาติสำหรับฐานข้อมูล
  • ระบบการถอดความประโยคพ้องความหมาย
  • ตัวแก้ไขข้อผิดพลาดทางไวยากรณ์
  • ระบบการเรียนรู้ภาษาโดยใช้คอมพิวเตอร์ช่วย
  • ที่ทำงานสำหรับมาร์กอัปวากยสัมพันธ์ของคลังข้อความ

ด้านล่างนี้ เราจะอธิบายลักษณะโมดูลทั้งหมดโดยสังเขป และเราจะพิจารณาหนึ่งในนั้น - โมดูล UNL - ในรายละเอียดเพิ่มเติม

2.1.1. ระบบแปลภาษา ETAP-3

โมดูลหลักของ ETAP-3 คือระบบแปลภาษาด้วยเครื่อง (MT) ที่ให้บริการห้าคู่ภาษา ระบบการแปลมีให้บริการสำหรับ (1) ภาษาอังกฤษเป็นภาษารัสเซีย (2) ภาษารัสเซียเป็นภาษาอังกฤษ (3) ภาษารัสเซียเป็นภาษาเกาหลี (4) ภาษารัสเซียเป็นภาษาฝรั่งเศส และ (5) ภาษารัสเซียเป็นภาษาเยอรมัน

จนถึงปัจจุบัน สองระบบแรกได้รับการพัฒนาอย่างละเอียดที่สุด ระบบการแปลจากภาษาอังกฤษเป็นภาษารัสเซียและจากภาษารัสเซียเป็นภาษาอังกฤษ ซึ่งถือได้ว่าเป็นโมดูลแบบสองทิศทางเดียว ได้รับการออกแบบมาเพื่อแปลข้อความจริง โดยส่วนใหญ่เป็นหัวข้อทางวิทยาศาสตร์และทางเทคนิค ผลลัพธ์ที่ดีที่สุดสำหรับข้อความเกี่ยวกับวิทยาการคอมพิวเตอร์ วิศวกรรมไฟฟ้า เศรษฐศาสตร์ และการเมือง เนื่องจากพจนานุกรมเกี่ยวกับภาษาที่ใช้ในการทำงานของระบบ (แต่ละพจนานุกรมมีประมาณ 50,000 รายการ) เน้นคำศัพท์ของสาขาวิชาเหล่านี้เป็นหลัก อย่างไรก็ตาม ETAP-3 ยังจัดการกับข้อความในหัวข้อในชีวิตประจำวัน เนื่องจากพจนานุกรมเมื่อเร็วๆ นี้ได้รับการเติมเต็มด้วยคำศัพท์ในชีวิตประจำวันอย่างมาก สำหรับแต่ละ lexeme ในพจนานุกรม combinatorial จะมีการให้คุณสมบัติ syntax, word-forming, semantic และ word-forming, รูปแบบการควบคุมของมัน เช่นเดียวกับข้อมูลเกี่ยวกับชุดวลีที่มี lexeme นี้

นอกจากนี้ยังมีพจนานุกรมสัณฐานวิทยาของรัสเซีย (รายการพจนานุกรม 100,000 รายการ) ซึ่งนอกเหนือจากข้อมูลทางสัณฐานวิทยาล้วน ๆ แล้วยังมีข้อมูลวากยสัมพันธ์พื้นฐานเกี่ยวกับ lexeme และการแปลที่เทียบเท่าโดยประมาณ พจนานุกรมสัณฐานวิทยาภาษาอังกฤษมีโครงสร้างเดียวกัน (60,000 รายการ) ระบบนี้ใช้คำอธิบายทางไวยากรณ์ที่ครอบคลุมของภาษาอังกฤษและรัสเซีย รวบรวมโดยนักพัฒนาซอฟต์แวร์ STAG-3

สำหรับคู่ภาษาอื่นๆ ระบบการแปลมีอยู่ที่ระดับของต้นแบบ

หาก STAGE-3 ได้รับประโยคที่มีคำพ้องเสียง และระบบไม่สามารถแก้ไขคำพ้องเสียงนี้ได้ จะมีตัวเลือกการแปลหลายตัวที่เอาต์พุต ในกรณีอื่นๆ ทั้งหมด ระบบจะสร้างโครงสร้างวากยสัมพันธ์ที่น่าเชื่อถือที่สุดหนึ่งโครงสร้างและการแปลที่น่าจะเป็นไปได้มากที่สุดอย่างหนึ่ง หากผู้ใช้ระบบต้องการรับการแปลที่เป็นไปได้ทั้งหมด เขาสามารถเลือกตัวเลือกที่เหมาะสม และระบบจะ "จดจำ" ทุกกรณีของคำพ้องเสียงที่ยังไม่ได้แก้ไข และให้โครงสร้างประโยคที่เป็นไปได้ทั้งหมดของประโยคที่มีเนื้อหาคำศัพท์ที่ยอมรับได้ พิจารณาหนึ่ง ตัวอย่างจริง. ประโยค พวกเขาให้ข้อสังเกตทั่วไปว่า...ด้วยตัวเลือก "ตัวเลือกการแปลทั้งหมด" ที่ถูกเลือก มันถูกแปลเป็นภาษารัสเซียในสองวิธีซึ่งแตกต่างกันทั้งในโครงสร้างวากยสัมพันธ์และในการเลือกคำศัพท์: (ก) พวกเขาให้ข้อสังเกตทั่วไปว่า...และ (ข) พวกเขาบังคับให้แม่ทัพชี้ให้เห็นว่า

2.1.2. อินเทอร์เฟซภาษาธรรมชาติสำหรับฐานข้อมูล

โมดูลของระบบ ETAP-3 นี้จะแปลข้อความค้นหาที่ให้ในรูปแบบอิสระในภาษาธรรมชาติ (อังกฤษหรือรัสเซีย) เป็นนิพจน์ภาษาการสืบค้น SQL โมดูลนี้ยังแปลจาก SQL เป็นภาษาธรรมชาติ โมดูลนี้ใช้องค์ประกอบเชิงความหมายที่พัฒนาขึ้นโดยเฉพาะสำหรับจุดประสงค์นี้ ซึ่งแปลโครงสร้างวากยสัมพันธ์เชิงลึกเป็นการแทนความหมายที่เป็นทางการ ซึ่งสามารถสลับไปใช้การแสดงแทนในภาษา SQL ได้อย่างง่ายดาย

2.1.3. ระบบการถอดความแบบพ้องความหมาย

โมดูลนี้ได้รับการออกแบบมาเพื่อทำการทดลองทางภาษาศาสตร์ เพื่อให้ได้ประโยคที่มีความหมายเหมือนกันและกึ่งคล้ายคลึงกันของภาษารัสเซียและ ประโยคภาษาอังกฤษ. ระบบนี้ใช้อุปกรณ์ของฟังก์ชันคำศัพท์ ซึ่งเป็นหนึ่งในนวัตกรรมที่สำคัญที่สุดของทฤษฎี "ความหมาย Û ข้อความ" ผลลัพธ์ของโมดูลการถอดความที่มีความหมายเหมือนกันสามารถแสดงได้โดยตัวอย่างต่อไปนี้:

(1) ผู้อำนวยการสั่งให้จอห์นเขียนรายงาน – ผู้กำกับสั่งให้จอห์นเขียนรายงาน – จอห์นได้รับคำสั่งจากผู้อำนวยการให้เขียนรายงาน – จอห์นได้รับคำสั่งจากผู้อำนวยการให้เขียนรายงาน

การวิจัยทางภาษาศาสตร์ในสาขานี้มีแนวโน้มที่ดี เนื่องจากมีการใช้งานที่หลากหลาย เช่น ในการสอนภาษาแม่และภาษาต่างประเทศ ในระบบการเขียนและระบบการวางแผนข้อความ

2.1.4. ตัวแก้ไขข้อผิดพลาดทางไวยากรณ์

โมดูลนี้ออกแบบมาสำหรับการประมวลผลข้อความในภาษารัสเซีย มีวัตถุประสงค์เพื่อค้นหาและแก้ไข ชนิดที่แตกต่างข้อผิดพลาดในข้อตกลงทางไวยากรณ์เช่นเดียวกับการจัดการกรณี

2.1.5 ระบบการสอนภาษาคอมพิวเตอร์

โมดูลนี้เป็นแอปพลิเคชันซอฟต์แวร์แบบสแตนด์อโลน กล่าวคือ เกมคอมพิวเตอร์ในรูปแบบของบทสนทนา โปรแกรมนี้สามารถใช้ในการสอนภาษารัสเซีย ภาษาอังกฤษ และ เยอรมันต่างประเทศ เกมนี้มีไว้สำหรับผู้ที่เชี่ยวชาญภาษาอยู่แล้ว แต่ต้องการขยายคำศัพท์ของพวกเขา โดยหลักๆ แล้วผ่านชุดวลีและการถอดความ ระบบจะขึ้นอยู่กับเครื่องมือของฟังก์ชันคำศัพท์ โปรแกรมนี้ยังสามารถใช้งานได้สำเร็จโดยเจ้าของภาษาที่ต้องการเพิ่มพูนคำศัพท์ของพวกเขา (เช่น นักข่าว ครู และแม้แต่นักการเมือง)

2.1.6. สถานที่ทำงานสำหรับมาร์กอัปวากยสัมพันธ์ของคลังข้อความ

โมดูลที่พัฒนาขึ้นใหม่นี้ใช้พจนานุกรม ETAP-3 รวมทั้งเครื่องวิเคราะห์ทางสัณฐานวิทยาและการแยกวิเคราะห์ของระบบ เพื่อสร้างคลังข้อมูลภาษารัสเซียที่ทำเครื่องหมายด้วยวากยสัมพันธ์ชุดแรก แอปพลิเคชั่นนี้ แบบผสม: โครงสร้างต้นไม้ที่ได้รับจากการวิเคราะห์อัตโนมัติจะได้รับการแก้ไขโดยบุคคลที่ใช้เครื่องมือกราฟิกที่สะดวก

2.2. คุณสมบัติหลักของระบบ

ในบรรดาคุณสมบัติหลักของระบบ ETAP-3 โดยรวมและแต่ละโมดูล สามารถสังเกตได้ดังต่อไปนี้:

  • การใช้กฎเป็นหน่วยพื้นฐานของอัลกอริทึม
  • วิธีการฉัตร
  • แปลผ่านขั้นตอนการโอน
  • การใช้ต้นไม้ไวยากรณ์การพึ่งพา
  • แนวทางการใช้คำศัพท์
  • ความสามารถในการรับตัวเลือกการแปล
  • ความเป็นไปได้ของการใช้ทรัพยากรทางภาษาที่หลากหลาย

ในเวอร์ชันปัจจุบันของ ETAP-3 โมดูลทั้งหมดใช้อัลกอริธึมตามกฎเท่านั้น อย่างไรก็ตาม ในการทดลองหลายครั้งเมื่อเร็วๆ นี้ โมดูล MT ได้รับการเสริมด้วยส่วนประกอบตามการเข้าถึงหน่วยความจำการแปล (หน่วยความจำการแปล) , และองค์ประกอบทางสถิติที่กึ่งอัตโนมัติแยกการแปลเทียบเท่าจาก corpora ข้อความสองภาษา (ดู Iomdin & Streiter 1999)

เช่นเดียวกับระบบประมวลผลข้อความภาษาธรรมชาติอื่นๆ ETAP-3 มีลักษณะเฉพาะโดยใช้วิธีการแบบเลเยอร์ ในระหว่างการประมวลผล แต่ละประโยคต้องผ่านหลายขั้นตอน และในแต่ละขั้นตอน จะแสดงในรูปแบบของโครงสร้างบางอย่าง: 1) สัณฐานวิทยา 2) วากยสัมพันธ์ และ 3) การทำให้เป็นมาตรฐาน (หรือวากยสัมพันธ์เชิงลึก) การแปลจริง (การถ่ายโอน) ดำเนินการที่ระดับของโครงสร้างวากยสัมพันธ์ที่เป็นมาตรฐานเช่น โครงสร้างที่ทำให้เป็นมาตรฐานของภาษาอังกฤษจะถูกแปลงเป็นโครงสร้างที่ทำให้เป็นมาตรฐานของรัสเซียที่สอดคล้องกันและในทางกลับกัน

สิ่งที่ทำให้ ETAP-3 แตกต่างจากระบบที่คล้ายคลึงกันส่วนใหญ่คือการใช้แผนผังการพึ่งพาวากยสัมพันธ์เพื่อแสดงโครงสร้างของประโยค (ระบบประมวลผลข้อความภาษาธรรมชาติส่วนใหญ่ทั่วโลกใช้โครงสร้างขององค์ประกอบโดยตรง)

ระยะที่ 3 มีลักษณะการใช้ศัพท์เฉพาะโดยที่ข้อมูลที่บันทึกไว้ในพจนานุกรมถือว่ามีความสำคัญพอๆ กับข้อมูลที่บันทึกไว้ในไวยากรณ์ ดังนั้น พจนานุกรม ETAP-3 จึงมีข้อมูลมากกว่าพจนานุกรมที่ใช้ในระบบอื่นๆ ที่คล้ายคลึงกันอย่างมีนัยสำคัญ รายการพจนานุกรมของ ETAP-3 ประกอบด้วยนอกเหนือจากชื่อของ lexeme ข้อมูลเกี่ยวกับคุณสมบัติทางวากยสัมพันธ์และความหมายของ lexeme โมเดลการจัดการ การแปลที่เทียบเท่า กฎต่างๆ รวมถึงค่าของฟังก์ชันคำศัพท์ , คำหลักที่เป็นศัพท์นี้ สัญญาณวากยสัมพันธ์คำแสดงลักษณะความสามารถหรือไม่สามารถที่จะกระทำในโครงสร้างวากยสัมพันธ์บางอย่าง คำสามารถกำหนดคุณลักษณะวากยสัมพันธ์หลายรายการจากรายการทั่วไปที่มีคุณลักษณะมากกว่า 200 รายการ คุณสมบัติความหมายจำเป็นต้องตรวจสอบข้อตกลงความหมายระหว่างคำในประโยค รูปแบบการจัดการคำนี้มีข้อมูลเกี่ยวกับการแสดงออกบนพื้นผิวของตัวแสดงของคำที่กำหนด (ตัวอย่างเช่น คำนี้สามารถควบคุมคำบุพบทหรือคำสันธานอย่างใดอย่างหนึ่งหรืออย่างอื่น หรือรูปแบบกรณีหนึ่งของชื่อ) ส่วนประกอบที่สำคัญที่สุด รายการพจนานุกรมเป็น กฎระเบียบกฎทั้งหมดใน STAGE-3 มีการแจกจ่ายระหว่างไวยากรณ์และคำศัพท์ กฎไวยากรณ์นั้นกว้างกว่าและใช้กับคำประเภทกว้างๆ ในขณะที่กฎที่อ้างถึงในรายการพจนานุกรม (โดยตรงหรือโดยการอ้างอิง) นำไปใช้กับกลุ่มคำเล็กๆ หรือแม้แต่คำเดี่ยว การจัดระเบียบกฎดังกล่าวทำให้มั่นใจได้ว่าระบบได้รับการกำหนดค่าโดยอัตโนมัติเพื่อดำเนินการกับข้อเสนอแต่ละรายการ ในระหว่างขั้นตอนการแปล กฎเหล่านั้นเท่านั้นที่เปิดใช้งาน การอ้างอิงซึ่งมีอยู่ในรายการพจนานุกรมของคำที่อยู่ในประโยคอย่างชัดเจน

เพื่อเป็นการยกตัวอย่าง เราขอนำเสนอส่วนของรายการพจนานุกรมของคำภาษาอังกฤษ โอกาส:

SYNT:COUNT,PREDTO,PREDTHAT

DES:"ข้อเท็จจริง", "นามธรรม"

D1.1: ของ,"บุคคล"

D2.1: ของ,"ข้อเท็จจริง"

D2.2: TO2

D2.3: That1

SYN1: โอกาส

แม็ก: ดี1/ยุติธรรม1/ดีเลิศ

แอนติมา: น้อย/ผอม/แย่/น้อย1/เล็ก

ปฏิบัติการ1: มี/ยืน1

REAL1-M: เอา

ANTIREAL1-M: MISS1

INCEPOPER1: รับ

FINOPER1: แพ้

CAUSFUNC1: ให้ /ให้

ทรานส์: โอกาส/ เกิดขึ้น

R:COMPOS/MODIF/POSSES

1.1 DEP-LEXA(X,Z,PREPOS,BY1)

1 ซัมรุซ:Z(PO1)

2 ซามรุซ:X(สุ่ม)

1 ZAMRUZ:Z(สุ่ม)

TRAF:RA-EXPANS.16

TRAF:RA-EXPANS.22

ในการพัฒนาระบบ ETAP-3 เราพยายามสร้างส่วนประกอบในลักษณะที่สามารถนำมาใช้เพื่อวัตถุประสงค์ที่หลากหลาย โดยเฉพาะอย่างยิ่ง ทรัพยากรทางไวยากรณ์และคำศัพท์หลักของระบบถูกใช้ในทุกโมดูล ตัวอย่างเช่น พจนานุกรมภาษารัสเซียถูกใช้ในขั้นตอนการวิเคราะห์เมื่อแปลจากภาษารัสเซียเป็นภาษาอังกฤษ และในขั้นตอนของการสังเคราะห์เมื่อแปลจากภาษาอังกฤษเป็นภาษารัสเซีย มีการใช้พจนานุกรมเดียวกันนี้ในโมดูล MP ในระบบถอดความ ในคลังข้อมูลที่มีการทำเครื่องหมายด้วยวากยสัมพันธ์ ฯลฯ นอกจากนี้ ทรัพยากรระบบบางส่วนสามารถ "แยกออก" ได้ และหลังจากปรับแต่งแล้วขึ้นอยู่กับความต้องการของลูกค้า สามารถใช้ในระบบประมวลผลต่างๆ ได้อย่างเป็นธรรมชาติ - ตัวหนังสือภาษา

2.3. สถาปัตยกรรมทั่วไปของระบบ ETAP-3

เพื่อให้แนวคิดทั่วไปเกี่ยวกับการทำงานของระบบ ETAP-3 เราขอนำเสนออัลกอริธึมทั่วไปของโมดูล MP (แบบที่ 1) โมดูลอื่น ๆ ทั้งหมดสามารถถือเป็นอนุพันธ์ของโมดูลนี้ได้ด้วยการสำรองบางอย่าง

โมดูลการแปลด้วยเครื่องของระบบ STAGE-3

(สถาปัตยกรรม)

2.4. การดำเนินการ

ระบบ ETAP-3 ถูกนำมาใช้บนคอมพิวเตอร์ MicroVax ( ระบบปฏิบัติการ VMS) เพิ่งสร้างใหม่ ซอฟต์แวร์สำหรับการทำงานกับ ETAP-3 บนคอมพิวเตอร์ส่วนบุคคลภายใต้ Windows NT 4.0 ซึ่งช่วยให้นักพจนานุกรมสามารถใช้เครื่องมือเพิ่มเติมจำนวนหนึ่ง และรักษาและแก้ไขพจนานุกรมได้อย่างมีประสิทธิภาพมากขึ้น

3. อินเทอร์เฟซสำหรับภาษา UNL

3.1 ความเป็นมาและเป้าหมาย

โมดูล UNL กำลังได้รับการพัฒนาโดยเป็นส่วนหนึ่งของโครงการระดับนานาชาติที่มีเป้าหมายที่ทะเยอทะยาน: อย่างน้อยก็เพื่อเอาชนะอุปสรรคทางภาษาที่แยกผู้ใช้อินเทอร์เน็ตออก แม้จะมีความจริงที่ว่าด้วยการถือกำเนิดของอินเทอร์เน็ตอุปสรรคทางโลกและทางพื้นที่ระหว่างผู้คนได้หายไปในทางปฏิบัติแล้วผู้ใช้อินเทอร์เน็ตยังคงถูกแยกจากกันด้วยอุปสรรคทางภาษา เห็นได้ชัดว่านี่เป็นอุปสรรคสำคัญต่อความสำเร็จในการสื่อสารระหว่างประเทศและระหว่างบุคคลในสังคมข้อมูล ความหลากหลายของภาษาพูดโดยผู้ใช้อินเทอร์เน็ตได้รับการยอมรับว่าเป็นหนึ่งใน ปัญหาเร่งด่วนมนุษยชาติ. ไม่ว่าในกรณีใด สิ่งนี้เห็นได้จากข้อเท็จจริงที่ว่าโครงการซึ่งมีจุดมุ่งหมายเพื่อแก้ปัญหานี้ ดำเนินการภายใต้การอุปถัมภ์ของสหประชาชาติ และได้รับการประสานงานโดยสถาบันเพื่อการศึกษาขั้นสูงของมหาวิทยาลัยแห่งสหประชาชาติ

โครงการนี้ก่อตั้งขึ้นในปี 2539 ปัจจุบันมีมหาวิทยาลัยและสถาบันวิจัย 15 แห่งจากบราซิล เยอรมนี อินเดีย อินโดนีเซีย จอร์แดน สเปน อิตาลี จีน ลัตเวีย มองโกเลีย รัสเซีย ไทย ฝรั่งเศส และญี่ปุ่นเข้าร่วมโครงการ

คาดว่าทีมจากประเทศอื่น ๆ จะเข้าร่วมโครงการในปีต่อ ๆ ไป เพื่อให้ครอบคลุมภาษาราชการของประเทศสมาชิก UN ทั้งหมดในที่สุด

แนวคิดของโครงการมีดังนี้ มีการเสนอภาษากลางที่เป็นสากลซึ่งทรงพลังพอที่จะแสดงออกได้ทั้งหมด ข้อมูลสำคัญซึ่งส่งผ่านข้อความในภาษาธรรมชาติ ภาษานี้คือ Universal Networking Language (UNL) ที่เสนอโดย H. Uchida (United Nations University) สำหรับภาษาธรรมชาติแต่ละภาษา เสนอให้พัฒนาสองระบบ: "ตัวถอดรหัส" ที่จะแปลข้อความจากภาษา UNL เป็นภาษาที่กำหนด และ "ตัวเข้ารหัส" ที่จะแปลงข้อความในภาษาที่กำหนดให้เป็นนิพจน์ภาษา UNL ควรเน้นว่าการสร้างข้อความ UNL จะไม่เป็นแบบอัตโนมัติทั้งหมด ขั้นตอนนี้วางแผนไว้เป็นบทสนทนาระหว่างคอมพิวเตอร์กับมนุษย์ (บรรณาธิการ)

ดังนั้น โครงการนี้จึงแตกต่างไปจากการแปลด้วยเครื่องแบบดั้งเดิมโดยพื้นฐาน ประการแรก อินพุตสำหรับสร้างข้อความในภาษาธรรมชาติต่างๆ คือโครงสร้าง UNL ซึ่งคุณภาพไม่ได้ขึ้นอยู่กับความไม่สมบูรณ์ของขั้นตอนการวิเคราะห์ข้อความ ระหว่างการสร้าง UNL แบบโต้ตอบ ตัวแก้ไขโครงสร้างจะตรวจสอบผลลัพธ์ของโปรแกรมเปลี่ยนไฟล์อัตโนมัติ แก้ไขข้อผิดพลาด และแก้ไขความกำกวมที่เหลือ ตัวแก้ไขสามารถเรียกใช้ตัวถอดรหัสและแปลสิ่งที่แก้ไขได้ UNL แสดงออกเป็นภาษาแม่ของคุณเพื่อตรวจสอบงานของคุณและเปลี่ยนแปลงนิพจน์เพิ่มเติมหากจำเป็น

ความแตกต่างที่สำคัญอีกประการของระบบ UNL จากการแปลด้วยเครื่องอยู่ที่การแสดงออกในภาษาสามารถสร้างและจัดเก็บ UNL ได้โดยไม่คำนึงถึงภาษาธรรมชาติที่จะแปลข้อความเหล่านี้ UNL ถือเป็นวิธีทั่วไปในการแสดงค่า ในการประมวลผลข้อความ UNL โดยอัตโนมัติ เช่น จัดทำดัชนี ค้นหา หรือดึงข้อมูล ไม่จำเป็นต้องแปลข้อความนี้เป็นภาษาธรรมชาติ สิ่งหลังจำเป็นก็ต่อเมื่อบุคคลจะทำงานกับข้อความ

ตัวเข้ารหัสและตัวถอดรหัสสำหรับภาษาธรรมชาติแต่ละภาษาจะสร้างเซิร์ฟเวอร์ภาษาที่วางแผนจะโฮสต์บนอินเทอร์เน็ต เซิร์ฟเวอร์ภาษาทั้งหมดจะเชื่อมต่อกับเครือข่าย UNL เดียว ซึ่งจะทำให้ผู้ใช้อินเทอร์เน็ตสามารถแปลเอกสารใดๆ จาก UNL เป็นภาษาของเขาเอง รวมทั้งแปลเป็น UNL ข้อความที่เขาต้องการให้เผยแพร่ต่อสาธารณะ

3.2 ภาษา UNL

ในบทความนี้ เราจะไม่สามารถอธิบายรายละเอียดของภาษา UNL ได้อย่างละเอียด เนื่องจากหัวข้อนี้สมควรได้รับบทความแยกต่างหาก ซึ่งอาจจะเขียนโดย Dr. Hiroshi Uchida ผู้สร้างภาษา เราจะพิจารณาเฉพาะคุณลักษณะเหล่านั้นของภาษา UNL ที่จะมีความสำคัญสำหรับการนำเสนอต่อไป ข้อกำหนดภาษา UNL ฉบับสมบูรณ์อยู่ที่ http://www.unl.ias.unu.edu/

UNL เป็นภาษาคอมพิวเตอร์ที่ออกแบบมาเพื่อแสดงข้อมูลในลักษณะที่สามารถสร้างข้อความที่มีข้อมูลนี้ในภาษาต่างๆ ได้หลากหลาย นิพจน์ UNL เป็นไฮเปอร์กราฟกำกับซึ่งสอดคล้องกับประโยคภาษาธรรมชาติ ส่วนโค้งของกราฟแสดงถึงความสัมพันธ์ทางความหมาย เช่น ตัวแทน(นักแสดงชาย)วัตถุ(วัตถุ)เวลา(เวลา),สถานที่(สถานที่),เครื่องดนตรี(เครื่องมือ),โหมด(วิธีดำเนินการ)และอื่น ๆ ในโหนดของกราฟเรียกว่า Universal Words (CS) ซึ่งแสดงถึงแนวคิดหรือกลุ่มของ CS โหนดสามารถให้แอตทริบิวต์ได้ แอตทริบิวต์มี ข้อมูลเพิ่มเติมเกี่ยวกับการใช้โหนดใน ข้อเสนอนี้, ตัวอย่างเช่น, @imperative, @generic, @future, @ภาระผูกพัน.

สหรัฐอเมริกาแต่ละแห่งสอดคล้องกับคำภาษาอังกฤษบางคำ บางคำมีตัวคั่นเชิงความหมายที่อธิบายความหมายของคำเหล่านี้ ในกรณีส่วนใหญ่ ตัวคั่นจะระบุตำแหน่งของแนวคิดในฐานความรู้ นี้จะทำในวิธีต่อไปนี้ คำสากลของชนิด เอ (icl>B)ตีความว่า 'A อยู่ในหมวด B' ตัวอย่างเช่น US โค้ชไม่มีตัวคั่น มีความหมายเดียวกับคำภาษาอังกฤษ โค้ชโดยทั่วไป. ตัวคั่นใช้เพื่อชี้แจงความหมายของคำ ใช่การแสดงออก โค้ช (icl>ขนส่ง)ควรเข้าใจว่าเป็น 'โค้ช เป็นพาหนะขนส่ง กล่าวคือ รสบัส; การแสดงออก โค้ช (icl>มนุษย์)มีการตีความ 'โค้ช เหมือนผู้ชาย นั่นคือ เทรนเนอร์และนิพจน์ โค้ช (icl>ทำ)- การตีความ 'โค้ช เป็นการกระทำชนิดหนึ่ง' นั่นคือ กริยา รถไฟ. กล่าวอีกนัยหนึ่ง เครื่องมือของตัวจำกัดทำให้สามารถแสดงสหรัฐอเมริกาเป็นคำภาษาอังกฤษที่มีความหมายเดียว นอกจากนี้ ข้อจำกัดยังช่วยให้คุณแนะนำแนวคิดซึ่งใน ภาษาอังกฤษไม่มีการกำหนดคำเดียว ตัวอย่างเช่นในรัสเซียมีกลุ่มคำกริยาของการเคลื่อนไหวมากมายซึ่งรวมถึงการบ่งชี้วิธีการหรือวิธีการเคลื่อนไหว: บินเข้าไป, ว่ายน้ำ คลาน วิ่งและอื่น ๆ ไม่มีการติดต่อภาษาอังกฤษหนึ่งคำสำหรับคำกริยาของกลุ่มนี้ อย่างไรก็ตาม บนพื้นฐานของคำภาษาอังกฤษ สามารถสร้าง ES ที่มีความหมายใกล้เคียงกันได้ เช่น มา (พบ>เรือ)หมายถึง 'ไปถึงยานพาหนะที่เป็นเรือ'

ให้เรายกตัวอย่างของนิพจน์ในภาษา UNL ที่สอดคล้องกับประโยคภาษาอังกฤษ

(2) อย่างไรก็ตาม ความแตกต่างทางภาษาเป็นอุปสรรคต่อการไหลของข้อมูลในสังคมของเราอย่างราบรื่น

แต่ละสาย UNL โครงสร้างคือการแสดงออกของรูปแบบ ความสัมพันธ์ (RS1, RS2)เพื่อความเรียบง่าย ละเว้นตัวคั่นความหมายสำหรับคำสากล

aoj( [ป้องกันอีเมล]@[ป้องกันอีเมล]@อย่างไรก็ตาม, [ป้องกันอีเมล])

สมัย ( [ป้องกันอีเมล]@[ป้องกันอีเมล]@อย่างไรก็ตาม, [ป้องกันอีเมล])

สมัย ( [ป้องกันอีเมล], ภาษา)

aoj(เรียบ, [ป้องกันอีเมล])

สมัย ( [ป้องกันอีเมล], ข้อมูล)

scn( [ป้องกันอีเมล], สังคม)

ตำแหน่ง (สังคม เรา)

3.3. แปลจาก UNL เป็นภาษารัสเซียในระบบ ETAP-3

ตามที่ระบุไว้ในหัวข้อที่ 1 ETAP-3 เป็นระบบถ่ายโอน และการแปลจริงจะดำเนินการในขั้นตอนของโครงสร้างวากยสัมพันธ์ปกติ (NormSS) ในระดับนี้ จะสะดวกที่สุดในการสร้างการติดต่อระหว่างภาษารัสเซียและ UNL เนื่องจากนิพจน์ภาษา UNL และโครงสร้างวากยสัมพันธ์ปกติเปิดเผยจำนวนมาก คุณสมบัติทั่วไป. นี่คือสิ่งที่สำคัญที่สุด:

  1. ทั้งนิพจน์ภาษา UNL และ NormSS อยู่ในตำแหน่งกลางระหว่างการแสดงพื้นผิวและความหมายของประโยค และประมาณจะสัมพันธ์กับระดับวากยสัมพันธ์ลึกที่เรียกว่า ในระดับนี้ ความหมายของหน่วยคำศัพท์จะไม่ถูกแยกออกเป็นพื้นฐาน และความสัมพันธ์ระหว่างหน่วยคำศัพท์จะเหมือนกันสำหรับทุกภาษา
  2. ในนิพจน์ UNL และ NormSS ทั้งสองโหนดเป็นองค์ประกอบเทอร์มินัล (หน่วยศัพท์) แทนที่จะเป็นหมวดหมู่วากยสัมพันธ์
  3. โหนดมีคุณสมบัติเพิ่มเติม (แอตทริบิวต์);
  4. ทั้งในนิพจน์ UNL และ NormSS ส่วนโค้งนั้นมีการพึ่งพาโดยตรง

ในเวลาเดียวกัน มีความแตกต่างที่สำคัญระหว่างนิพจน์ UNL และ NormSS:

  1. ใน NormSS โหนดทั้งหมดเป็นหน่วยคำศัพท์ และใน UNL โหนดสามารถเป็นกราฟย่อยได้
  2. ใน NormSS โหนดจะสอดคล้องกับค่าของคำเดียวเสมอ และค่า SS สามารถกว้างหรือแคบกว่าค่าของคำภาษาอังกฤษที่สอดคล้องกัน:

2.1. ค่าของ CSS สามารถสอดคล้องกับค่าต่างๆ ของหนึ่งคำในครั้งเดียว (ดูด้านบน)

2.2. สามารถจับคู่วลีฟรีได้ (เช่น ที่ใช้คอมพิวเตอร์หรือ คุณภาพสูง).

2.3. อาจสอดคล้องกับรูปแบบคำบางคำ (เช่น คำว่า ดีที่สุดเป็นรูปแบบคำ ดีหรือ ดี).

2.4. พวกเขาสามารถแสดงถึงแนวคิดที่ไม่มีสิ่งที่เทียบเท่าในภาษาอังกฤษโดยตรง

  1. NormSS เป็นกราฟที่เชื่อมต่อกันที่ง่ายที่สุด กล่าวคือ ต้นไม้ ในขณะที่นิพจน์ UNL จะเป็นไฮเปอร์กราฟ
  2. ใน UNL ส่วนโค้งสามารถสร้างลูปและเชื่อมโยงแต่ละกราฟย่อยได้
  3. โหนดใน NormSS เชื่อมต่อกันด้วยความสัมพันธ์แบบวากยสัมพันธ์ล้วนๆ ซึ่งไม่มีความหมายใดๆ ในขณะที่ความสัมพันธ์ใน UNL แสดงถึงบทบาทเชิงความหมาย
  4. คุณลักษณะใน NormSS สอดคล้องกับลักษณะทางไวยากรณ์ ในขณะที่ความหมายของคุณลักษณะ UNL จำนวนมากนั้นสื่อความหมายโดยใช้คำศัพท์ ทั้งในภาษาอังกฤษและภาษารัสเซีย (เช่น คำกริยาช่วย)
  5. NormSS มีข้อมูลเกี่ยวกับลำดับของคำในประโยค และข้อมูลดังกล่าวไม่มีอยู่ในนิพจน์ UNL

ข้อเสนอ NormSS (2) มีดังนี้:


  1. การเปลี่ยนจากนิพจน์ UNL เป็นการเป็นตัวแทนระดับกลาง (IR)
  2. การเปลี่ยนจาก PP เป็น Russian NormSS (NormSSR)
  3. การสังเคราะห์ข้อเสนอของรัสเซียสำหรับ NormSSR

ขั้นตอนแรกคือส่วนต่อประสานระหว่างUNL และระบบ ETAP-3 และส่วนที่เหลือดำเนินการโดยใช้วิธีการมาตรฐานของโมดูลภาษาอังกฤษ-รัสเซียของระบบ ETAP-3

อัลกอริธึมการแปลจาก UNL เป็นภาษารัสเซียแสดงไว้ในแผนงานที่ 3

จากข้างบนนี้ การเปลี่ยนจากนิพจน์ในภาษา UNL เป็น NormSS ควรแก้ปัญหาห้างานต่อไปนี้:

  1. แทนที่ CL ทั้งหมดด้วยคำภาษาอังกฤษทุกที่ที่ทำได้ ศัพท์ภาษารัสเซียจะปรากฏที่เวที รับแปลภาษาอังกฤษ-รัสเซียเมื่อพูดถึงพจนานุกรมภาษาอังกฤษ หากไม่พบ RS เทียบเท่าภาษาอังกฤษ ค่า RS นี้ควรแสดงด้วยวิธีอื่น
  2. แปลภาษา ความสัมพันธ์ทางวากยสัมพันธ์ภาษา UNL ในความสัมพันธ์แบบวากยสัมพันธ์ของ STEP-3 ไม่ว่าจะโดยตรงหรือด้วยความช่วยเหลือของคำศัพท์
  3. แปลแอตทริบิวต์ภาษา UNL เป็นลักษณะทางไวยากรณ์ของ STAGE-3 ไม่ว่าจะโดยตรงหรือโดยใช้คำศัพท์
  4. แปลงกราฟ UNL เป็นแผนผังการพึ่งพา
  5. กำหนดลำดับของคำในประโยค

งานแรกและ (บางส่วน) งานที่สองได้รับการแก้ไขด้วยความช่วยเหลือของพจนานุกรม UNL - ภาษาอังกฤษและภาษาอังกฤษแบบผสมผสาน สำหรับงานอื่นๆ ทั้งหมด กฎที่เขียนด้วยภาษา FORET ที่เป็นทางการจะมีความรับผิดชอบ

ดังนั้นงานทั้งหมดเหล่านี้จะได้รับการแก้ไขด้วยความช่วยเหลือของพจนานุกรมหรือด้วยความช่วยเหลือของกฎ กฎแบ่งออกเป็นสามประเภทขึ้นอยู่กับระดับของความเป็นสากล: กฎทั่วไป ลายฉลุ และคำศัพท์มีความโดดเด่น กฎทั่วไปสามารถเปิดใช้งานได้เมื่อมีการประมวลผลข้อเสนอใดๆ กฎอีกสองประเภทจะใช้ได้ก็ต่อเมื่อประโยคที่กำลังประมวลผลมีคำที่มีการอ้างอิงถึงกฎบางอย่าง (ในกรณีของกฎเทมเพลต) หรือตัวกฎเอง (ในกรณีของกฎพจนานุกรม) การจัดระเบียบกฎดังกล่าวช่วยให้มั่นใจได้ว่าการปรับระบบอัตโนมัติ: เปิดใช้งานเฉพาะกฎที่จำเป็นในการประมวลผลข้อเสนอเฉพาะเท่านั้น

3.4. สถานการณ์ปัจจุบันและแผนงานในอนาคต

รุ่นทดลองของโมดูลการแปล UNL เป็นภาษารัสเซียมีอยู่ที่ http://proling.iitp.ru/Deco ภายในฤดูร้อนปี 2000 เราวางแผนที่จะทำให้โมดูลนี้พร้อมสำหรับการใช้งานทั่วไป งานต่อไปของเราคือการสร้างโปรแกรมเปลี่ยนไฟล์แบบโต้ตอบ

ตามที่ชัดเจนจากแผนงาน 3 อินเทอร์เฟซระหว่าง UNL กับโครงสร้างที่โมดูลการแปลด้วยเครื่อง ETAP-3 ทำงานที่ระดับ NormSS ภาษาอังกฤษ จากแผนภาพเดียวกันจะเห็นได้ว่า แปลภาษาอังกฤษต้นฉบับUNL การแสดงออกเป็นผลพลอยได้ตามธรรมชาติของสถาปัตยกรรมดังกล่าว เมื่อต้องการทำสิ่งนี้ การส่ง NormSS ภาษาอังกฤษเพื่อการสังเคราะห์ก็เพียงพอแล้ว มีการทดลองที่ประสบความสำเร็จหลายครั้งในทิศทางนี้แล้ว

วรรณกรรม

ยูดี Apresyan, I.M. Boguslavsky, L.L. Iomdin และอื่น ๆ. (1992 เอ ). ตัวประมวลผลภาษาศาสตร์สำหรับความซับซ้อน ระบบข้อมูล. วิทยาศาสตร์, 256 น.ม.

จู. D. Apresjan, I. M. Boguslavsky, L. L. Iomdin etอัล. (1992b). ETAP-2: ภาษาศาสตร์ของระบบการแปลด้วยเครื่อง. // เมต้า, ฉบับที่. 37 ฉบับที่ 1 น. 97-112.

อิกอร์ โบกุสลาฟสกี (1995) ระบบแปลภาษารัสเซียเป็นอังกฤษแบบสองทิศทาง (ETAP-3) // การดำเนินการของการประชุมสุดยอดการแปลด้วยเครื่อง V. ลักเซมเบิร์ก

ลีโอนิด ไอออมดิน และ โอลิเวอร์ สไตรเตอร์ (1999). เรียนรู้จาก Parallel Corpora: การทดลองในการแปลด้วยเครื่อง // Dialogue"99: Computational Linguistics and its Applications International Workshop. Tarusa, Russia, June 1999. Vol.2, pp. 79-88.

การศึกษาที่บทความนี้ทุ่มเทได้รับการสนับสนุนทางการเงินบางส่วนจากมูลนิธิรัสเซียเพื่อการวิจัยขั้นพื้นฐาน (หมายเลข 99-06-80277)