ซัมซุงพาเจาะลึกเบื้องหลังการพัฒนา AI ให้เรียนรู้ภาษาใหม่ ทำไมต้องเริ่มจากข้อมูล

ซัมซุง ในฐานะผู้นำด้านการสร้างประสบการณ์ชั้นเลิศในการใช้ AI บนมือถือ ขออาสาพาทุกคนเดินทางไปเยี่ยมชมการทำงานของศูนย์วิจัยซัมซุงทั่วโลก เพื่อทำความรู้จัก Galaxy AI ในแง่มุมใหม่ ๆ ตลอดจนเข้าใจวิธีการในการช่วยให้ผู้คนจำนวนมากได้พัฒนาศักยภาพของตัวเองจนถึงขีดสุด ซึ่งปัจจุบัน Galaxy AI สามารถรองรับได้ถึง 16 ภาษาของ ช่วยยกระดับขีดความสามารถทางภาษาของผู้คนได้มากขึ้น พร้อมด้วยฟีเจอร์การแปลภาษาบนอุปกรณ์แบบออฟไลน์ เช่น Live Translate, Interpreter, Note Assist และ Browsing Assist แล้วการพัฒนาภาษาสำหรับ AI เกี่ยวข้องกับอะไรบ้าง บทความนี้จะพาไปค้นพบความท้าทายของการทำงานกับ AI บนอุปกรณ์เคลื่อนที่ และล้วงลึกเบื้องหลังวิธีการสอน AI ของซัมซุงในการเรียนรู้ภาษาใหม่ โดยบอกเล่าผ่านทีมวิจัยซัมซุงในอินโดนีเซีย ผู้อยู่เบื้องหลังพลังคนและนวัตกรรมที่ขับเคลื่อนให้ทุกคนเข้าถึง AI ได้โดยเสรี

Junaidillah Fadlil หัวหน้าทีม AI ของสถาบันวิจัยและพัฒนาซัมซุง อินโดนีเซีย (SRIN)

เริ่มแรกต้องกำหนดเป้าหมายก่อน Junaidillah Fadlil หัวหน้าทีม AI ของสถาบันวิจัยและพัฒนาซัมซุง อินโดนีเซีย (SRIN) ซึ่งเป็นทีมที่เพิ่งเพิ่มการรองรับภาษาบาฮาซา อินโดนีเซียบน Galaxy AI กล่าวว่า “AI ที่ยอดเยี่ยมตั้งต้นจากข้อมูลที่เกี่ยวข้องและมีคุณภาพ ทุกภาษาต้องการวิธีประมวลผลที่แตกต่างกัน เราจึงต้องศึกษาลึกลงไปเพื่อทำความเข้าใจความต้องการด้านภาษาศาสตร์และบริบทแวดล้อมที่เป็นอัตลักษณ์ของประเทศของเรา การพัฒนาภาษาท้องถิ่นต้องตั้งต้นจากข้อมูลเชิงลึกและวิทยาศาสตร์ ดังนั้นทุกกระบวนการในการเพิ่มภาษาลงใน Galaxy AI จึงเริ่มต้นด้วยการวางแผนว่า เราต้องการข้อมูลอะไรที่จะสามารถหามาได้อย่างถูกต้องตามกฎหมายและหลักจริยธรรม”

Live Translate เป็นฟีเจอร์หนึ่งของ Galaxy AI ที่มี 3 กระบวนการหลักในการใช้งาน ประกอบด้วย การรู้จำเสียงพูดอัตโนมัติ (Automatic Speech Recognition : ASR) การแปลด้วยเครื่องที่จำลองการทำงานของระบบประสาท (Neural Machine Translation : NMT) และการแปลงข้อความเป็นคำพูด (Text-to-speech : TTS) โดยแต่ละกระบวนการต้องการชุดข้อมูลที่แตกต่างกันไป

Live Translate

ตัวอย่างเช่น ASR ต้องการเสียงจำนวนมากที่บันทึกไว้ในสภาพแวดล้อมที่หลากหลาย ซึ่งแต่ละเสียงที่บันทึกไว้จะได้รับการถอดเสียงเป็นข้อความไว้อย่างแม่นยำ ระดับเสียงรบกวนที่แตกต่างกันไปช่วยอธิบายสภาพแวดล้อมที่แตกต่างกัน “มันไม่ใช่แค่การบันทึกเสียง” Muchlisin Adi Saputra หัวหน้าทีม ASR กล่าวเสริม “นอกเหนือจากข้อมูลทางภาษาที่เราได้รับจากบุคคลภายนอกที่เป็นพันธมิตรของเรา เรายังต้องออกไปบันทึกเสียงเองในร้านกาแฟหรือในสภาพแวดล้อมการทำงานต่าง ๆ เพื่อจะได้จับเสียงที่เป็นเอกลักษณ์จากชีวิตจริงได้อย่างถูกต้อง เช่น เสียงคนตะโกนเรียกกัน หรือเสียงรัวแป้นคีย์บอร์ด

Muchlisin Adi Saputra หัวหน้าทีม ASR

นอกจากนี้ ยังต้องคำนึงถึงธรรมชาติของภาษาที่เปลี่ยนแปลงอยู่ตลอดเวลาด้วย “เราต้องอัปเดตให้ทันคำสแลงใหม่ ๆ และวิธีการใช้งาน ซึ่งส่วนใหญ่เราจะเรียนรู้สิ่งเหล่านี้จากโซเชียลมีเดีย!” Saputra กล่าว

สำหรับ NMT ต้องใช้ข้อมูลจากการฝึกแปล “การแปลภาษาบาฮาซาอินโดนีเซียเป็นความท้าทายที่เราเจอ” Muhamad Faisal หัวหน้า NMT ของทีมกล่าว “การเลือกใช้ความหมายตามบริบทและความหมายตรงตัวขึ้นอยู่กับนัยแอบแฝงในแต่ละสถานการณ์และสังคม ดังนั้นเราจึงต้องการข้อความที่แปลไว้แล้วจำนวนมากเพื่อให้ AI ใช้อ้างอิงสำหรับคำศัพท์ใหม่ คำต่างประเทศ คำนามเฉพาะ สำนวน ตลอดจนข้อมูลใด ๆ ที่จะช่วยให้ AI เข้าใจบริบทและหลักการสื่อสาร”

Harits Abdurrohman หัวหน้าทีม TTS

สุดท้าย TTS จำเป็นต้องอาศัยการบันทึกเสียงที่ครอบคลุมเสียงและน้ำเสียงที่หลากหลาย พร้อมบริบทเพิ่มเติมเกี่ยวกับคำที่ออกเสียงในสถานการณ์ที่แตกต่างกันไป “การบันทึกเสียงที่ดีช่วยได้มากกว่าครึ่ง และครอบคลุมหน่วยเสียงที่จำเป็นเกือบทั้งหมดสำหรับ AI” Harits Abdurrohman หัวหน้าทีม TTS กล่าวเสริม “หากคนพากษ์เสียงทำงานได้ดีเยี่ยม เราจะสามารถพัฒนา AI ให้ออกเสียงคำเฉพาะให้มีความชัดเจนเพิ่มมากขึ้นได้ต่อไป”

จับมือแข็งแกร่งขึ้นไปด้วยกัน

การวางแผนข้อมูลจำนวนมากนั้นต้องการทรัพยากรจำนวนมหาศาล ทีมวิจัยและพัฒนาซัมซุงอินโดนีเซีย (SRIN) ได้ทำงานร่วมมือกับผู้เชี่ยวชาญด้านภาษาศาสตร์อย่างใกล้ชิด คุณ Junaidillah Fadlil กล่าวว่า “ความท้าทายนี้เราต้องใช้ความคิดสร้างสรรค์ ความเฉลียวฉลาด และความเชี่ยวชาญทั้งในภาษาบาฮาซาอินโดนีเซียและการเรียนรู้ของเครื่อง (machine learning) ปรัชญาการทำงานร่วมกันแบบเปิดกว้างกับพันธมิตรต่าง ๆ ของซัมซุงมีส่วนสำคัญอย่างมากที่ทำให้ภารกิจนี้สำเร็จ เช่นเดียวกับความสำเร็จของเราในการขยายขนาดธุรกิจและพัฒนา AI”

การทำงานร่วมกับศูนย์วิจัย ซัมซุงอื่น ๆ ทั่วโลกทำให้ SRIN สามารถนำแนวปฏิบัติที่เป็นเลิศมาปรับใช้ได้อย่างรวดเร็วและเอาชนะความซับซ้อนในการกำหนดเป้าหมายของข้อมูลได้ นอกจากนี้ ความร่วมมือยังเป็นประโยชน์ต่อการพัฒนาทั้งเทคโนโลยีและวัฒนธรรม เมื่อทีม SRIN ทำงานร่วมกับคู่ค้าในบังกาลอร์ ประเทศอินเดีย พวกเขาได้เรียนรู้ประเพณีการถือศีลอดของท้องถิ่น ได้มีโอกาสขยายเครือข่ายความสัมพันธ์ระหว่างกันอย่างลึกซึ้งและเข้าใจมากยิ่งขึ้นเกี่ยวกับวัฒนธรรมที่แตกต่างกัน

ทีม SRIN

สำหรับทีม SRIN โครงการขยายภาษา Galaxy AI นับเป็นการเปิดมิติใหม่ในการเรียนรู้ “เรารู้สึกภูมิใจมากกับความสำเร็จที่เกิดขึ้น เนื่อจากเป็นโครงการ AI แรกของพวกเรา และแน่นอนว่าไม่ใช่โครงการสุดท้าย เพราะเราจะยังคงเดินหน้าปรับปรุงโมเดลการทำงานและยกระดับคุณภาพของผลงานให้ดียิ่งขึ้นไป การพัฒนาครั้งนี้ไม่เพียงแต่สะท้อนถึงค่านิยมที่ความเปิดกว้างของเราเท่านั้น แต่ยังแสดงออกถึงความเคารพและสะท้อนอัตลักษณ์ทางวัฒนธรรมของพวกเราผ่านภาษา” Fadlil กล่าวทิ้งท้าย

ในบทความตอนต่อไป เราจะพาทุกคนเดินทางไปที่สถาบันวิจัยและพัฒนาซัมซุงประเทศจอร์แดน เพื่อพูดคุยกับทีมที่รับผิดชอบหลักในการพัฒนาโครงการภาษาอาหรับของ Galaxy AI สำหรับคนที่สนใจอย่าลืมติดตามเรื่องราวความท้าทายในการสร้างและพัฒนาโมเดล AI สำหรับภาษาถิ่นที่หลากหลาย เพื่อไม่ให้พลาดสาระดี ๆ จากซัมซุง

:

บทความเทคโนโลยี#GalaxyAIThe Learning Curve
โปรแกรมค้นหาเวอร์ชันล่าสุด