មុន​នឹង​កុំព្យូទ័រ​អាច​បកប្រែ​ភាសា​បាន​ច្រើន ដំបូង​​វា​ដូច​កូន​ក្មេង​ចឹង!

  • 2017-12-10 02:15:00
  • ចំនួនមតិ 0 | ចំនួនចែករំលែក 0

ចន្លោះមិនឃើញ

ទំព័រ​បកប្រែ​របស់ Google បាន​ជួយ​ដល់​ការ​ទំនាក់ទំនង និង​យល់​ដឹង​ពី​ភាសា​ផ្សេងៗ​ជាច្រើន ដែល​អាច​ដំណើរការ​បាន​ទាំង​លើ​កុំព្យូទ័រ និង​ទូរស័ព្ទ ក្នុង​ការ​បកប្រែ​ភាសា​បាន​ច្រើន​ជាង ១០០ ភាសា​។ ពេល​និយាយ​អំពី Google Translate អាច​សំដៅ​លើ​ប្រព័ន្ធ​ម៉ាស៊ីន​បកប្រែ (Machine translation engine) ដែល​ជា​កម្មវិធី​មួយ​ប្រភេទ​។ ម៉ាស៊ីន​បកប្រែ​ដំណើរការ​មិន​ងាយស្រួល​នោះ​ទេ ដោយសារ​ភាសា​ជាច្រើន​មាន​ពាក្យ​មិន​ត្រូវ​គ្នា​ទៅ​វិញ​ទៅ​មក​។ ឧទាហរណ៍​លើ​ពាក្យ​មួយ "Honeymoon" មិនមែន​មាន​ន័យ​ថា​ព្រះចន្ទ​បង្កើត​ពី​ទឹក​ឃ្មុំ​នោះ​ទេ តែ​សំដៅ​លើ​ដំណើរ​កំសាន្ត​គូ​ស្វាមី​ថ្មី​ក្រោយ​ពេល​រៀបការ​។ ដូច្នេះ​ការ​បកប្រែ អត្ថន័យ​ពិត​ជា​សំខាន់ ជាង​ពាក្យ​មួយៗ​។ 

ប្រសិនបើ​ការ​បកប្រែ​មាន​ការ​លំបាក​ដល់​មនុស្ស ចុះ​មាន​វិធី​អ្វី​បាន​ជា​អាច​បង្រៀន​កុំព្យូទ័រ​ឲ្យ​ធ្វើ​បែប​នេះ​បាន​។ វា​មាន​ការ​លំបាក តែ​អ្នក​សរសេរ​កម្មវិធី​បាន​បង្កើត​ជា​ដំណាក់​កាលៗ ក្នុង​ការ​ជួយ​ដល់​ខួរក្បាល​អេឡិចត្រូនិក​ដើម្បី​បកប្រែ​ភាសា​បរទេស​។ 

ការ​សិក្សា​លើ​រូបមន្ត និង​ដឹង​ពេល​បំបែក​រូបមន្ត​

ប្រព័ន្ធ​ម៉ាស៊ីន​បកប្រែ ឬ Machine translation ឬ MT រៀន​ដូច​ទៅ​នឹង​ក្មេង​ដូច្នេះ​ដែរ​។ ក្នុង​ម៉ាស៊ីន​បកប្រែ​មាន​ខួរក្បាល​មួយ​ហៅថា Engine ដែល​ទទេ​ស្អាត រហូត​ដល់​ពេល​បំពេញ​នូវ​ពាក្យ​ជាច្រើន​។ ពាក្យ​ថា "Honeymoon" ពេល​ខ្លះ​បញ្ចូល​តែ​មួយ​ពាក្យ ឬ​មាន​ក្នុង​ឃ្លា ឬ​ក្នុង​ប្រយោគ​ដូចជា "My mom and dad went to Gatlinburg on their honeymoon."

ខួរ​ក្បាល​របស់ MT ដំណើរការ​ពាក្យ​ទាំងនេះ​ដោយ​ផ្អែក​លើ​ពីរ​វិធី​រួមមាន ផ្អែក​លើ​រូបមន្ត និង​ផ្អែក​លើ​ឥរិយាបថ ក្នុង​ការ​យល់​ពី​ភាសា ដូច​ទៅ​នឹង​មនុស្ស​ដែរ​។ MT រៀន​ពាក្យ​នីមួយៗ​បន្តិចម្ដងៗ​ពេល​ពាក្យ​ត្រូវ​បាន​ប្រើប្រាស់ ហើយ​វា​ក៏​រៀន​អ្វី​មួយ​ដោយ​សម្គាល់​ពេល​ពាក្យ​មិន​ត្រូវ​បាន​ប្រើប្រាស់​ដែរ​។ Engine ផ្អែក​លើ​ឥរិយាបថ​ជួយ​ដល់ MT យល់​ពី​ការ​ប្រើប្រាស់​ពាក្យ​ជាក់លាក់ តែ​មិន​ទាន់​គ្រប់គ្រាន់​ក្នុង​ការ​ផ្តល់​នូវ​លទ្ធភាព​ត្រឹមត្រូវ​នោះ​ទេ ដូច្នេះ​ទើប​មាន Engine ផ្អែក​លើ​រូបមន្ត​ក្នុង​ការ​ជួយ​ដល់ MT យល់​នូវ​វេយ្យាករណ៍​នៃ​ភាសា​នីមួយៗ ថា​តើ​អ្វី​ជា​នាម អ្វី​ជា​កិរិយាសព្ទ និង​សំណង់​ប្រយោគ​ទាក់ទង​ផ្សេងៗ​ទៀត​។ មាន​បញ្ហា​មួយ​ដោយ ពេល​ខ្លះ​មនុស្ស​មិន​បាន​បញ្ចូល​នូវ​ឃ្លា ឬ​ប្រយោគ​ត្រឹមត្រូវ​តាម​វេយ្យាករណ៍​នោះ​ទេ ដូច្នេះ​បាន​បំបែក​នូវ​រូបមន្ត​ដោយ​ឥរិយាបថ​នេះ​។ កុំព្យូទ័រ​មិន​អាច​បំបែក​នូវ​រូបមន្ត​បាន​ទេ​ ដោយសារ​វា​មិន​ដឹង​ថា​ធ្វើ​ដោយ​របៀប​ណា​។ ដូច្នេះ​មាន​តែ Artificial intelligence ប៉ុណ្ណោះ​អាច​បំបែក​រូបមន្ត​បាន តែ​ត្រូវការ​បង្វឹក បង្រៀន​។ MT ត្រូវ​តែ​រៀន​រូបមន្ត​សម្រាប់​ពេល​ណា​ប្រើ​រូបមន្ត និង​ការ​បំបែក​រូបមន្ត ដោយ​ត្រូវការ​សិក្សា​ទាំង​ឥរិយាបថ និង​រូបមន្ត ក្នុង​ការ​ទទួល​បាន​លទ្ធផល​ល្អ​។ 

ពាក្យ​ជា​ច្រើន​ដូច​ទៅ​នឹង​ម្ហូប​ដែរ​

Engine ដែល​សិក្សា​ទាំង​រូបមន្ត និង​ឥរិយាបថ​ហៅថា Hybrid។ អ្នក​សរសេរ​កម្មវិធី​កុំព្យូទ័រ​ហ្វឹកហាត់​លក្ខណៈ Hybrid នេះ​ដោយ​ប្រើប្រាស់​នូវ​បណ្ដុំ​ព័ត៌មាន​ដ៏​ធំ មិនមែន​គ្រាន់​តែ​ពាក្យ ឬ​ឃ្លា​ដាច់​ដោយ​ឡែក​នោះ​ទេ​។ Hybrid ភាគ​ច្រើន​សិក្សា​ពី​ទិន្នន័យ ដោយ​អ្នក​អភិវឌ្ឍន៍ MT ចាប់ផ្តើម​បន្ថែម​នូវ​ពាក្យ និង​ឃ្លា​ដែល​បាន​បកប្រែ​ចំនួន​ដ៏​ធំ​ទៅ​កាន់ Engine។ ពួកគេ​ផ្តល់​ឲ្យ MT engine ក្មេង​ខ្ចី​មួយ​នូវ​បណ្ណាល័យ​នៃ​ការ​បកប្រែ​មួយ​ពី​ភាសា​មួយ ទៅ​ភាសា​ដទៃ​ទៀត ដូច្នេះ​ប្រព័ន្ធ MT មាន​ការ​យល់ដឹង​ទាំង​ពាក្យ និង​វេយ្យាករណ៍​ក្នុង​ភាសា​នីមួយៗ។ ពី​មុន អ្នក​សរសេរ​កម្មវិធី MT បាន​ហ្វឹកហាត់ Engine ជាមួយ​សៀវភៅ​ជាច្រើន​ទាំងស្រុង​។ សៀវភៅ​មាន​ទាំង​ប្រយោគ​ស្រប​តាម​រូបមន្ត​វេយ្យាករណ៍ និង​មិន​ស្រប ហើយ​ម៉ាស៊ីន​បកប្រែ​ខ្លះ​ដូចជា​របស់​ក្រុមហ៊ុន Sovee បាន​បញ្ចូល​នូវ​ព្រះ​គម្ពីរ​ថែម​ទៀត​ក្នុង​ការ​ហ្វឹកហាត់ MT engine របស់​ខ្លួន​។

កុំ​ផ្តល់ Engine នូវ​អាហារ​មិន​ល្អ​

MT engine មាន​នូវ​ពាក្យ​ជាច្រើន​ក្នុង​ការ​យល់​ពី​ភាសា​បាន​ល្អ។ MT engine បន្ត​ត្រូវ​ការ​ពាក្យ​ជាច្រើន​ដើម្បី​ពង្រីក​សមត្ថភាព​ក្នុង​ការ​បកប្រែ​ឲ្យ​កាន់​តែ​ល្អ ក្នុង​នោះ​មនុស្ស​អាច​នឹង​ផ្តល់​នូវ​អត្ថន័យ​ថ្មី​លើ​ពាក្យ​ចាស់ ឬ​ពាក្យ​គ្រាម​ភាសា​ជា​ច្រើន ឬ​បណ្តាល​ភាសា​បច្ចេកទេស​មួយ​ចំនួន​ទៀត ដូច្នេះ MT engine ត្រូវ​បង្កើន​សមត្ថភាព​ក្នុង​ការ​យល់​ពី​អក្សរ​អស់​ទាំង​នេះ​។ ភាសា​ដែល Google បកប្រែ​មិន​សូវ​ល្អ​គឺ Somali ព្រោះ​មិន​សូវ​មាន​ការ​ស្វែងរក​ការ​បកប្រែ​លើ​ Google Translate។ Google Translate ឬ MT engine ដទៃ​ទៀត​កាន់​តែ​ឆ្លាត​ពេល​មាន​ពាក្យ ឬ​ឃ្លា​កាន់​តែ​ច្រើន​។ Google បាន​បង្ហាញ​ថា​មនុស្ស​បាន​បញ្ចូល​ច្រើន​ជាង ១៤០ ពាន់​លាន​ពាក្យ​ទៅ​កាន់ Google Translate ជា​រៀងរាល់​ថ្ងៃ ដូច្នេះ MT engine របស់​ខ្លួន​មិនមែន​ជា​ក្មេង​ខ្ចី​នោះ​ទេ​។ មួយ​វិញ​ទៀត អ្នក​គួរ​ដឹង ពេល​អ្នក​បន្ថែម​ពាក្យ​មិន​ល្អ ឬ​ក្លែងក្លាយ​ច្រើន នោះ​សុខភាព ឬ​តម្លៃ​ពាក្យ​ក្នុង MT engine ក៏​ទៅ​តាម​នោះ​ដែរ ព្រោះ​វា​រៀន​ពី​អ្នក​ដោយ​ពាក្យ​អ្នក​បញ្ចូល​។ 

នាំ​ម៉ាស៊ីន​បកប្រែ​ទៅ​កាន់​អ្នក​គ្រប់គ្នា​

អ្នក​សរសេរ​កុំព្យូទ័រ​បាន​បកប្រែ​កម្មវិធី​បកប្រែ​ភាសា​តាំង​ពី​ឆ្នាំ ១៩៦០ ហើយ​ការ​អភិវឌ្ឍន៍​ធំ​បច្ចុប្បន្ន​គឺ Neural MT។ Neural សំដៅ​លើ​ប្រព័ន្ធ​ប្រសាទ​ខួរក្បាល​។ ថ្វី​បើ MT engine កង្វះ​ប្រព័ន្ធ​ប្រសាទ​ពិត តែ​ពួកគេ​ត្រូវ​បាន​រចនា​ត្រាប់​តាម​មុខងារ​ប្រព័ន្ធ​ប្រសាទ​ក្នុង​ខួរក្បាល​មនុស្ស ហើយ​ប្រភេទ Neural នេះ​អាច​ជួយ MT ចេញ​ពី​ការ​លិច​លង់​បាន​។ MT ត្រូវ​ការ​ Engine ដាច់​ដោយ​លែក​ក្នុង​ការ​បកប្រែ​ទៅ​កាន់​ភាសា​នីមួយៗ តែ Neural engine មិន​ធ្វើ​បែប​នេះ​ទេ​។ ក្រុមហ៊ុន Microsoft ជា​ក្រុមហ៊ុន​ដំបូង​បញ្ចេញ​នូវ​ប្រព័ន្ធ Neural MT ហើយ​បច្ចុប្បន្ន Google មាន​ជំនាន់​ផ្ទាល់​ខ្លួន ដោយ​ប្រព័ន្ធ​នេះ​អាច​អនុញ្ញាត​ឲ្យ​ប្រព័ន្ធ​តែមួយ​ធ្វើ​ការ​បកប្រែ​រវាង​ភាសា​ជាច្រើន​។ 

ឧទាហរណ៍​អ្នក​ចង់​និយាយ​អ្វី​មួយ​ជា​ភាសា​ជប៉ុន កូរ៉េ និង​អង់គ្លេស​។ មុន​ពេល​ប្រព័ន្ធ Neural កើតឡើង កុំព្យូទ័រ​ត្រូវការ Engine បី​ផ្សេងគ្នា​ដើម្បី​ដំណើរការ​ការងារ​នេះ​។ មួយ​បកប្រែ​ភាសា​ជប៉ុន​ទៅ​អង់គ្លេស​, មួយ​បកប្រែ​ភាសា​កូរ៉េ​ទៅ​អង់គ្លេស និង​មួយ​ទៀត​បម្លែង​ភាសា​ជប៉ុន​ទៅ​កូរ៉េ​។ 

Neural MT ប្រើ​នូវ Engine ធំ​មួយ​ដើម្បី​រក្សា​វេយ្យាករណ៍ ពាក្យ ដែល​ជា​បណ្តាល​ព័ត៌មាន​ពី​ការ​បកប្រែ​ភាសា​ទៅ​មក​នៃ​ភាសា​នោះ ដែល​អាច​ឲ្យ​អ្នក​សរសេរ​កម្មវិធី​ធ្វើការ​បម្លែង​ភាសា​ជប៉ុន​ទៅ​កូរ៉េ​ដោយ​ប្រើ​ព័ត៌មាន​ពី​ការ​បកប្រែ​ភាសា​ពីរ​ដំបូង (ភាសា​ជប៉ុន និង​កូរ៉េ ទៅ​កាន់​អង់គ្លេស​)។ Neural MT មិន​អាច​បង្កើន​ល្បឿន​បកប្រែ​ភាសា​ថ្មី​នោះ​ទេ ហើយ​ក៏​មិន​អាច​ជួយ​ដោះស្រាយ MT ច្រើន​ជាង​មួយ Subject (ដូចជា​អាហារ កីឡា ជំនួញ ឬ​វិទ្យាសាស្ត្រ​) ក្នុង​ពេល​តែ​មួយ​ផង​ដែរ​។ ជា​រួម ក្រុមហ៊ុន​បកប្រែ និង​សមាគមន៍​លូតលាស់​ជា​បន្តបន្ទាប់​នៃ MT engine ក្មេង​ខ្ចី​នេះ ​ត្រូវការ​អ្នក​ចូលរួម​៕

ទទួលបានព័ត៌មានថ្មីៗ គន្លឹះមានប្រយោជន៍រួមទាំងចំណេះដឹងផ្សេងៗពីបច្ចេកវិទ្យា Like Page Sabay News Technology...

អានអត្ថបទ

ប្រភព៖ sciencenewsforstudents.org   ប្រែ​សម្រួល៖ ប៊ុនធឿន

អត្ថបទថ្មី