เราสามารถทำ Speech to Text ใน web browser ได้เลย เท่าที่ลองเล่นจะเวิร์คเฉพาะแค่บน Chrome เจ้าเดียวอยู่ โดยใช้ได้ทั้ง Chrome Desktop และ Chrome for Android แต่ Chrome for Android จะมี bug คืน result มาซ้ำๆกันอยู่ ต้องเขียน handle กันเอาเอง ซึ่งถ้าใครจะใช้งานใน Android เป็นหลักแนะนำเป็นตัวถัดไป ( Android Voice Typing ) จะเนียนกว่า แต่สำหรับ version Chrome Desktop นั้นต้องบอกว่าเนียนไม่แพ้ Google Cloud Speech-to-Text เลยทีเดียว Show
Speech to text DemoWeb Speech APIdiewland.github.io Android Voice Typingตัวนี้ติดมากับ keyboard ของ Android เลย วิธีการใช้งานคือกดรูปไมโครโฟนแล้วพูดได้เลย หลังจากพูดจบทิ้งระยะซักครู่ ระบบจะทำการแปลงข้อความให้เราอัตโนมัติ ซึ่ง Google ได้เปิดช่องให้เราสามารถใช้ Voice Typing กับแอปของเราได้ง่ายๆโดยทำการเรียก intent [Android Code] เปลี่ยนเสียงพูดให้กลายเป็นข้อความด้วย Voice RecognitionVoice Recognition (บ้างก็เรียกว่า Speech Recognition) หรือที่รู้จักกันในนามของฟีเจอร์สั่งงานด้วยเสียง…www.akexorcist.com Google Cloud Speech-to-Textผู้ให้บริการที่เป็น Cloud Service มีอยู่ 2 เจ้าคือ Google และ Microsoft ทั้ง 2 เจ้ารองรับ input ทั้งจากไมโครโฟนและแบบไฟล์เสียง ราคาต่างกันเล็กน้อย ( เดี๋ยวจะมีเทียบราคาด้านล่างอีกทีนึง ) ส่วนตัวไหนถอดความแม่นกว่ากันนั้น ต้องทดลองเล่นกันเองนะครับ Cloud Speech-to-Text - Speech Recognition | Cloud Speech-to-Text API | Google CloudCloud Speech-to-Text provides fast and accurate speech recognition, converting audio, either from a microphone or from…cloud.google.com Speech to Text API | Microsoft AzureConvert spoken audio to text. Call the API to recognize audio coming from the microphone, from other real-time…azure.microsoft.com จะเห็นว่าเอาจริงๆแล้วลำพัง Speech-to-Text แบบฟรีก็ใช้งานได้โอเคแล้ว ทำไมเรายังจำเป็นต้องใช้บริการแบบเสียตังอีก ? ขอตอบเป็นข้อๆดังนี้
เมื่อทราบข้อดีของการใช้ Speech-to-Text แบบเสียเงินแล้ว มาดูราคากันซักหน่อยครับ 💸💸 ราคาของ Google คิดจาก default package ที่ $0.006 / 15 วินาทีจะเห็นว่า Microsoft ราคาถูกกว่าเล็กน้อย ส่วน Google จริงๆแล้วมี 2 แพ็คเกจ ตัว default $0.006 / 15 วิ เป็นแบบไม่นำข้อมูลไปทำอย่างอื่นต่อ แต่ถ้าเราไม่ซีเรียสเรื่องข้อมูล คือยอมให้ Google เอาข้อมูลเราไปทำอย่างอื่นต่อได้ เราสามารถเลือกเป็นแพ็คเกจ $0.004 / 15 วิ ซึ่งราคาถูกว่าได้ Text to Speech (TTS)Local Machine TTSคือการใช้ TTS Engine ของเครื่องในการสร้างเสียงขึ้นมา ข้อดีสุดๆคือใช้งานได้ฟรี และทำงาน offline ได้ แต่เนื่องจากมันคือ TTS ของเครื่องดังนั้นในแต่ละเครื่องก็จะได้เสียงที่แตกต่างกันออกไป เช่น Windows 10 จะเป็นเสียงผู้ชาย ( Pattara ) ส่วน Android จะเป็นเสียงผู้หญิงเย็นๆ เหมือนกับใน Google Translate Text to speech DemoWeb Speechi APIdiewland.github.io [Android Code] การทำ Text To Speech เพื่ออ่านข้อความที่ต้องการบนแอนดรอยด์จะมีคลาสที่ชื่อว่า TextToSpeech ให้ใช้งานอยู่แล้ว โดยการเรียกใช้งาน TTS เนี่ย มันจะต้องทำการ Initialize…www.akexorcist.com Google Translate TTSใครเคยเล่น Google Translate จะเห็นว่าเราสามารถกดฟังเสียงจากประโยคที่เราพิมพ์ หรือประโยคที่เราแปลได้ ( ภาษาไทยจะเป็นผู้หญิงเสียงเย็นๆ ) API ตรงนี้เราสามารถใช้งานได้ฟรี แต่ เนื่องจากว่า API ดังกล่าวไม่ใช่ Official API ดังนั้นมีโอกาสที่ API ตัวนี้จะหายไปได้ตลอดเวลา แต่ (อีกครั้ง) API ตัวนี้ออนไลน์มาตั้งแต่ปี 2012 แล้วจนถึงปัจจุบันก็ยังใช้งานได้อยู่ ใครอยากใช้ API ตัวนี้ก็ต้องบวกลบความเสี่ยงกันเอาเองนะครับ 😈 diewland/google-translate-ttsText to speech service from Google Translate. Contribute to diewland/google-translate-tts development by creating an…github.com Responsive Voiceเป็นบริการเดียวที่มีเสียงภาษาไทยให้เลือกทั้งชาย และหญิง แถมราคาเป็นมิตรสุดๆ ลองกดเล่นเสียงดูก่อนได้จากเว็บด้านล่างได้เลยครับ ResponsiveVoice Text To Speech - ResponsiveVoice.JS Text to SpeechHTML5 introduces the Speech API for Speech Synthesis and Speech Recognition. This is the easiest way to use the spoken…responsivevoice.org Azure Text-to-SpeechAzure ใช้เสียงของนาย Pattara มาปล่อยเป็น cloud service ด้วย แต่เนื่องจากมันคือ Engine เดียวกับตัว Offline TTS ใน Windows 10 แบบเป๊ะๆ ทำให้ความน่าสนใจลดลงเยอะเลย ( จะเสียเงินทำไมเมื่อผลลัพท์เท่ากับของฟรี :/ ) Text to Speech API | Microsoft AzureImprove user experience and accessibility for your apps by converting text to speech. Text to Speech gives you speech…azure.microsoft.com TTS สู้กัน 2 เจ้า Azure กับ ResponsiveVoice ส่วน Google หลุดไปจุดที่น่าสนใจของการคิดราคาของ TTS ของ Microsoft คือคิดเป็นรายตัวอักษร ตรงนี้ต้องอ่านรายละเอียดกันให้ดีๆเพราะ 1 คำของแต่ละภาษาย่อมแตกต่างกันออกไป บางภาษา 1 ตัวอักษรแทน 1 คำ ( จีน/คันจิของญี่ปุ่น ) แต่บางภาษา 1 คำประกอบด้วยหลายๆ ตัวอักษร ( เช่นภาษาไทย เป็นต้น ) ส่วน ResponsiveVoice มีการคิดแพ็คเกจแบบป๋ามากคือเหมาไปเลย แถมถ้าเหมารายปี ได้รับส่วนลดอีกตังหาก จบลงแล้วสำหรับสรุป STT/TTS ภาษาไทย เป็นบทความที่ยาวที่สุดตั้งแต่เคยเขียนมาเลยครับ ขาดตกบกพร่องประการใดฝากแปะไว้ในคอมเม้นนะครับ เดี๋ยวปรับแก้ให้ แล้วเจอกันใหม่บทความหน้า สวัสดีครับ |