មុននឹងកុំព្យូទ័រអាចបកប្រែភាសាបានច្រើន ដំបូងវាដូចកូនក្មេងចឹង!
- 2017-12-10 02:15:00
- ចំនួនមតិ 0 | ចំនួនចែករំលែក 0
មុននឹងកុំព្យូទ័រអាចបកប្រែភាសាបានច្រើន ដំបូងវាដូចកូនក្មេងចឹង!
ចន្លោះមិនឃើញ
ទំព័របកប្រែរបស់ Google បានជួយដល់ការទំនាក់ទំនង និងយល់ដឹងពីភាសាផ្សេងៗជាច្រើន ដែលអាចដំណើរការបានទាំងលើកុំព្យូទ័រ និងទូរស័ព្ទ ក្នុងការបកប្រែភាសាបានច្រើនជាង ១០០ ភាសា។ ពេលនិយាយអំពី Google Translate អាចសំដៅលើប្រព័ន្ធម៉ាស៊ីនបកប្រែ (Machine translation engine) ដែលជាកម្មវិធីមួយប្រភេទ។ ម៉ាស៊ីនបកប្រែដំណើរការមិនងាយស្រួលនោះទេ ដោយសារភាសាជាច្រើនមានពាក្យមិនត្រូវគ្នាទៅវិញទៅមក។ ឧទាហរណ៍លើពាក្យមួយ "Honeymoon" មិនមែនមានន័យថាព្រះចន្ទបង្កើតពីទឹកឃ្មុំនោះទេ តែសំដៅលើដំណើរកំសាន្តគូស្វាមីថ្មីក្រោយពេលរៀបការ។ ដូច្នេះការបកប្រែ អត្ថន័យពិតជាសំខាន់ ជាងពាក្យមួយៗ។
ប្រសិនបើការបកប្រែមានការលំបាកដល់មនុស្ស ចុះមានវិធីអ្វីបានជាអាចបង្រៀនកុំព្យូទ័រឲ្យធ្វើបែបនេះបាន។ វាមានការលំបាក តែអ្នកសរសេរកម្មវិធីបានបង្កើតជាដំណាក់កាលៗ ក្នុងការជួយដល់ខួរក្បាលអេឡិចត្រូនិកដើម្បីបកប្រែភាសាបរទេស។
ប្រព័ន្ធម៉ាស៊ីនបកប្រែ ឬ Machine translation ឬ MT រៀនដូចទៅនឹងក្មេងដូច្នេះដែរ។ ក្នុងម៉ាស៊ីនបកប្រែមានខួរក្បាលមួយហៅថា Engine ដែលទទេស្អាត រហូតដល់ពេលបំពេញនូវពាក្យជាច្រើន។ ពាក្យថា "Honeymoon" ពេលខ្លះបញ្ចូលតែមួយពាក្យ ឬមានក្នុងឃ្លា ឬក្នុងប្រយោគដូចជា "My mom and dad went to Gatlinburg on their honeymoon."
ខួរក្បាលរបស់ MT ដំណើរការពាក្យទាំងនេះដោយផ្អែកលើពីរវិធីរួមមាន ផ្អែកលើរូបមន្ត និងផ្អែកលើឥរិយាបថ ក្នុងការយល់ពីភាសា ដូចទៅនឹងមនុស្សដែរ។ MT រៀនពាក្យនីមួយៗបន្តិចម្ដងៗពេលពាក្យត្រូវបានប្រើប្រាស់ ហើយវាក៏រៀនអ្វីមួយដោយសម្គាល់ពេលពាក្យមិនត្រូវបានប្រើប្រាស់ដែរ។ Engine ផ្អែកលើឥរិយាបថជួយដល់ MT យល់ពីការប្រើប្រាស់ពាក្យជាក់លាក់ តែមិនទាន់គ្រប់គ្រាន់ក្នុងការផ្តល់នូវលទ្ធភាពត្រឹមត្រូវនោះទេ ដូច្នេះទើបមាន Engine ផ្អែកលើរូបមន្តក្នុងការជួយដល់ MT យល់នូវវេយ្យាករណ៍នៃភាសានីមួយៗ ថាតើអ្វីជានាម អ្វីជាកិរិយាសព្ទ និងសំណង់ប្រយោគទាក់ទងផ្សេងៗទៀត។ មានបញ្ហាមួយដោយ ពេលខ្លះមនុស្សមិនបានបញ្ចូលនូវឃ្លា ឬប្រយោគត្រឹមត្រូវតាមវេយ្យាករណ៍នោះទេ ដូច្នេះបានបំបែកនូវរូបមន្តដោយឥរិយាបថនេះ។ កុំព្យូទ័រមិនអាចបំបែកនូវរូបមន្តបានទេ ដោយសារវាមិនដឹងថាធ្វើដោយរបៀបណា។ ដូច្នេះមានតែ Artificial intelligence ប៉ុណ្ណោះអាចបំបែករូបមន្តបាន តែត្រូវការបង្វឹក បង្រៀន។ MT ត្រូវតែរៀនរូបមន្តសម្រាប់ពេលណាប្រើរូបមន្ត និងការបំបែករូបមន្ត ដោយត្រូវការសិក្សាទាំងឥរិយាបថ និងរូបមន្ត ក្នុងការទទួលបានលទ្ធផលល្អ។
Engine ដែលសិក្សាទាំងរូបមន្ត និងឥរិយាបថហៅថា Hybrid។ អ្នកសរសេរកម្មវិធីកុំព្យូទ័រហ្វឹកហាត់លក្ខណៈ Hybrid នេះដោយប្រើប្រាស់នូវបណ្ដុំព័ត៌មានដ៏ធំ មិនមែនគ្រាន់តែពាក្យ ឬឃ្លាដាច់ដោយឡែកនោះទេ។ Hybrid ភាគច្រើនសិក្សាពីទិន្នន័យ ដោយអ្នកអភិវឌ្ឍន៍ MT ចាប់ផ្តើមបន្ថែមនូវពាក្យ និងឃ្លាដែលបានបកប្រែចំនួនដ៏ធំទៅកាន់ Engine។ ពួកគេផ្តល់ឲ្យ MT engine ក្មេងខ្ចីមួយនូវបណ្ណាល័យនៃការបកប្រែមួយពីភាសាមួយ ទៅភាសាដទៃទៀត ដូច្នេះប្រព័ន្ធ MT មានការយល់ដឹងទាំងពាក្យ និងវេយ្យាករណ៍ក្នុងភាសានីមួយៗ។ ពីមុន អ្នកសរសេរកម្មវិធី MT បានហ្វឹកហាត់ Engine ជាមួយសៀវភៅជាច្រើនទាំងស្រុង។ សៀវភៅមានទាំងប្រយោគស្របតាមរូបមន្តវេយ្យាករណ៍ និងមិនស្រប ហើយម៉ាស៊ីនបកប្រែខ្លះដូចជារបស់ក្រុមហ៊ុន Sovee បានបញ្ចូលនូវព្រះគម្ពីរថែមទៀតក្នុងការហ្វឹកហាត់ MT engine របស់ខ្លួន។
MT engine មាននូវពាក្យជាច្រើនក្នុងការយល់ពីភាសាបានល្អ។ MT engine បន្តត្រូវការពាក្យជាច្រើនដើម្បីពង្រីកសមត្ថភាពក្នុងការបកប្រែឲ្យកាន់តែល្អ ក្នុងនោះមនុស្សអាចនឹងផ្តល់នូវអត្ថន័យថ្មីលើពាក្យចាស់ ឬពាក្យគ្រាមភាសាជាច្រើន ឬបណ្តាលភាសាបច្ចេកទេសមួយចំនួនទៀត ដូច្នេះ MT engine ត្រូវបង្កើនសមត្ថភាពក្នុងការយល់ពីអក្សរអស់ទាំងនេះ។ ភាសាដែល Google បកប្រែមិនសូវល្អគឺ Somali ព្រោះមិនសូវមានការស្វែងរកការបកប្រែលើ Google Translate។ Google Translate ឬ MT engine ដទៃទៀតកាន់តែឆ្លាតពេលមានពាក្យ ឬឃ្លាកាន់តែច្រើន។ Google បានបង្ហាញថាមនុស្សបានបញ្ចូលច្រើនជាង ១៤០ ពាន់លានពាក្យទៅកាន់ Google Translate ជារៀងរាល់ថ្ងៃ ដូច្នេះ MT engine របស់ខ្លួនមិនមែនជាក្មេងខ្ចីនោះទេ។ មួយវិញទៀត អ្នកគួរដឹង ពេលអ្នកបន្ថែមពាក្យមិនល្អ ឬក្លែងក្លាយច្រើន នោះសុខភាព ឬតម្លៃពាក្យក្នុង MT engine ក៏ទៅតាមនោះដែរ ព្រោះវារៀនពីអ្នកដោយពាក្យអ្នកបញ្ចូល។
អ្នកសរសេរកុំព្យូទ័របានបកប្រែកម្មវិធីបកប្រែភាសាតាំងពីឆ្នាំ ១៩៦០ ហើយការអភិវឌ្ឍន៍ធំបច្ចុប្បន្នគឺ Neural MT។ Neural សំដៅលើប្រព័ន្ធប្រសាទខួរក្បាល។ ថ្វីបើ MT engine កង្វះប្រព័ន្ធប្រសាទពិត តែពួកគេត្រូវបានរចនាត្រាប់តាមមុខងារប្រព័ន្ធប្រសាទក្នុងខួរក្បាលមនុស្ស ហើយប្រភេទ Neural នេះអាចជួយ MT ចេញពីការលិចលង់បាន។ MT ត្រូវការ Engine ដាច់ដោយលែកក្នុងការបកប្រែទៅកាន់ភាសានីមួយៗ តែ Neural engine មិនធ្វើបែបនេះទេ។ ក្រុមហ៊ុន Microsoft ជាក្រុមហ៊ុនដំបូងបញ្ចេញនូវប្រព័ន្ធ Neural MT ហើយបច្ចុប្បន្ន Google មានជំនាន់ផ្ទាល់ខ្លួន ដោយប្រព័ន្ធនេះអាចអនុញ្ញាតឲ្យប្រព័ន្ធតែមួយធ្វើការបកប្រែរវាងភាសាជាច្រើន។
ឧទាហរណ៍អ្នកចង់និយាយអ្វីមួយជាភាសាជប៉ុន កូរ៉េ និងអង់គ្លេស។ មុនពេលប្រព័ន្ធ Neural កើតឡើង កុំព្យូទ័រត្រូវការ Engine បីផ្សេងគ្នាដើម្បីដំណើរការការងារនេះ។ មួយបកប្រែភាសាជប៉ុនទៅអង់គ្លេស, មួយបកប្រែភាសាកូរ៉េទៅអង់គ្លេស និងមួយទៀតបម្លែងភាសាជប៉ុនទៅកូរ៉េ។
Neural MT ប្រើនូវ Engine ធំមួយដើម្បីរក្សាវេយ្យាករណ៍ ពាក្យ ដែលជាបណ្តាលព័ត៌មានពីការបកប្រែភាសាទៅមកនៃភាសានោះ ដែលអាចឲ្យអ្នកសរសេរកម្មវិធីធ្វើការបម្លែងភាសាជប៉ុនទៅកូរ៉េដោយប្រើព័ត៌មានពីការបកប្រែភាសាពីរដំបូង (ភាសាជប៉ុន និងកូរ៉េ ទៅកាន់អង់គ្លេស)។ Neural MT មិនអាចបង្កើនល្បឿនបកប្រែភាសាថ្មីនោះទេ ហើយក៏មិនអាចជួយដោះស្រាយ MT ច្រើនជាងមួយ Subject (ដូចជាអាហារ កីឡា ជំនួញ ឬវិទ្យាសាស្ត្រ) ក្នុងពេលតែមួយផងដែរ។ ជារួម ក្រុមហ៊ុនបកប្រែ និងសមាគមន៍លូតលាស់ជាបន្តបន្ទាប់នៃ MT engine ក្មេងខ្ចីនេះ ត្រូវការអ្នកចូលរួម៕
ទទួលបានព័ត៌មានថ្មីៗ គន្លឹះមានប្រយោជន៍រួមទាំងចំណេះដឹងផ្សេងៗពីបច្ចេកវិទ្យា Like Page Sabay News Technology...
អានអត្ថបទ