Iphone Text To Speech Speech To Text

iPhone Text-to-Speech, Speech-to-Text

flickr:5733716266



Apple ได้จดสิทธิบัตร Text-to-Speech and Speech-to-Text เป็นที่เรียบร้อย

สรุปเนื้อหาข่าว
เมื่อวันที่ 12 พฤษภาคม 2554 ที่ผ่านมา US Patent และ Trademark Office ได้ทำการจดสิทธิบัตร application ตัวใหม่ของ Apple เป็นที่เรียบร้อยโดย Patent application ตัวใหม่นี้คือ การใช้เทคโนโลยี Text-to-Speech และ Speech-to-Text Converters เพื่อตอบสนองความต้องการและพัฒนาให้การสื่อสารในสถานการณ์ต่อไปนี้ของผู้ใช้ iPhone เป็นไปได้อย่างมีประสิทธิภาพมากขึ้น

1) Communicating in Noisy Environments การที่ผู้ใช้ iPhone ต้องการโทรออกหรือรับสายในสภาพแวดล้อมที่เสียงดัง เช่นในร้านอาหาร ทำให้การสนทนาระหว่างผู้ใช้และคู่สนทนาเป็นไปอย่างติดขัด ไม่มีประสิทธิภาพทั้งจากเสียงรบกวนและจากการตะโกนเสียงเพื่อกลบเสียงรอบข้าง ซึ่งสุดท้ายแล้วอาจนำไปสู่ความจำเป็นในการจบบทสนทนา

2) Unable to Communicate During a Meeting ในสถานการณ์ตรงข้ามกับข้อ 1 ผู้ใช้ iPhone อาจไม่สามารถพูดสายได้ เช่นผู้ใช้อาจอยู่ระหว่างการประชุม จึงจำเป็นต้องกระซิบกับคู่สนทนา ทำให้เกิดความไม่เข้าใจในบทสนทนา หรือทำให้ผู้ใช้ต้องส่งข้อความแทนในขณะที่อีกฝ่ายอาจอยู่ใน landline ซึ่งไม่สามารถรับข้อความดังกล่าวได้

flickr:5733716700



สิ่งที่จำเป็นสำหรับ Patent นี้คือ microphone สำหรับวัดระดับเสียง และ noise meter เพื่อแสดงระดับเสียงบนหน้าจอโทรศัพท์ เมื่อระดับเสียงในห้องดังถึงระดับที่กำหนด เมื่อมีโทรศัพท์เรียกเข้า ผู้ใช้สมารถตอบโดยใช้หลาย option รวมถึง text-to-speech, regular text, a pre-recorded message, หรือ voice mail

Built in text-to-speech converter สามารถแปลง text จากเครื่องผู้ใช้ไปเป็นเสียงสู่เครื่องผู้รับโดยอัตโนมัติ โดยที่ผู้รับสามารถพูดตอบกลับหรือแปลงเสียงตอบกลับดังกล่าวเป็น text กลับไปยังเครื่องผู้ใช้

ทั้งนี้มีการเชื่อกันว่า Apple อยู่ในกระบวนการรวมกันของ enhanced voice-recognition software กับ future version ของ iOS โดยรายงานฉบับหนึ่งได้กล่าวว่า Apple กำลังเป็น partner กับ Nuance ซึ่งเป็นผู้ผลิต voice control software สำหรับ voice software ของ iOS 5 ซึ่งคาดว่าจะเปิดตัวที่ Apple's Worldwide Developers Conference ใน San Francisco


การทำงานของ Text-to-Speech & Speech-to-Text Patent

The Proposed Communications System
Apple's patent FIG. 1 is a diagram illustrating a communication environment in which a near-end communication device (e.g., a near-end phone 100) is engaged in, or about to be engaged in, a communication (e.g., phone call) with a far-end communication device (e.g., a far-end phone 98) via a communication network (e.g., wireless network 120). The term "communication device" broadly refers to various real-time communication devices, e.g., landline telephone system (POTS) end stations, voice-over-IP end stations, cellular handsets, smart phones, computing devices, etc.

flickr:5733717996



In one embodiment, the microphone (113) could be used to monitor the noise level in the environment surrounding the near-end phone 100. In an alternative embodiment, a separate microphone could be used to monitor the environmental noise. A noise meter (152) may be shown on the display screen to indicate the detected noise level. The noise meter may be shown when a phone call is made or received, when the noise level reaches the vicinity of a pre-determined threshold, or as long as the near-end phone is powered on. The noise level may be indicated by the noise meter by colors, numeral values, height or length of a bar indicator, etc.

flickr:5733719740



About Apple's patent FIG. 4 : in response to the detection of the relative or particular noise level at the near end, the near-end phone displays a number of options for the user to choose. The options may include: text-to-speech, two-way text, play (pre-recorded) message, and voicemail. The user may select one of these options using a physical button or a virtual button. In one embodiment, the near-end phone also displays the noise meter on the display screen to provide a visual indication of the environmental noise level at the near-end.

About Apple's patent FIG. 5: if the near-end user selects the text-to-speech option, the display may show "TEXT TO SPEECH" to indicate that the text-to-speech conversion has been activated. The near-end user may use a physical keyboard or a virtual keyboard to input text messages. The display also shows an outgoing message area that displays the text entered by the near-end user. As the near-end user inputs the text, the text-to-speech converter automatically converts the text into speech. The near-end phone transmits the converted speech signal to the far-end user, utilizing the audio connection that has already been established between the near-end user and the far-end user.

About Apple's patent FIG. 6: if the user selects the two-way text option, the display may show "TWO-WAY TEXT" to indicate that both of the text-to-speech and speech-to-text conversions have been activated. The near-end user may use a physical keyboard or a virtual keyboard to input text messages. The display shows an incoming message area 612 for displaying the text converted from the far-end user, and an outgoing message area 613 for displaying the text entered by the near-end user. The established audio connection carries two-way voice signals between the near-end and the far-end users. The conversions from text to speech and from speech to text are performed by the near-end phone. The far-end user could speak to the far-end phone in the same way as in a normal telephone conversation that does not involve text messages.
Apple credits Baptiste Paquier, Aram Lindahl and Phillip Tamchina as the inventors of patent application 20110111805, originally filed in Q4 2009.


การวิเคราะห์ข่าว

1. Innovation Technology: New Apple Application นี้กล่าวได้ว่าเป็น new innovative technology ที่เพิ่งได้รับการจดสิทธิบัตร สิ่งนี้ย่อมแสดงถึงการพัฒนาเทคโนโลยีที่มีประโยชน์ อีกทั้งยังสามารถนำไปใช้ได้จริงของ Apple ที่ตอบสนองความต้องการของลูกค้าในการช่วยให้การสนทนาของผู้ใช้ iPhone เป็นไปอย่างมีประสิทธิภาพมากขึ้น
2. Legal Strength: โดยทั่วไป Protection ของสิทธิบัตรนั้นมีอายุขั้นต่ำถึง 20 ปีไม่ว่าจะเป็นสิทธิบัตรประเภทใดก็ตาม การที่ application ตัวนี้ได้รับการจดสิทธิบัตรนั้น ย่อมทำให้ Apple ได้เปรียบทางกฎหมายหากมีการล่วงละเมิดสิทธิบัตรดังกล่าว
3. Customer Royalty : Application ใหม่นี้ย่อมเป็นโอกาสของ Apple ในการสร้างฐานลูกค้าได้ก่อนเมื่อนำ application ใหม่ออกสู่ตลาด ทำให้เกิด brand royalty ต่อ Apple ซึ่งย่อมเป็นจุดแข็งในวงการ smart phone ที่มีการแข่งขันอย่างสูงในปัจจุบัน
4. Brand Image: ทั้งการพัฒนา application ตัวใหม่และการได้รับการจดสิทธิบัตรนั้น ย่อมทำให้ Apple มี brand image ที่ดีทั้งในด้านการพัฒนาอย่างต่อเนื่องเพื่อตอบสนองความต้องการของลูกค้าและในด้าน innovation
5. Competitive Advantage: สิทธิบัตรตัวนี้ อาจสื่อถึงการสร้าง competitive advantage ของ Apple นั่นคือ
5.1 Cost Leadership; การที่คู่แข่งหรือองค์กรอื่นๆที่ต้องการจะนำสิทธิบัตรของ Apple ตัวนี้ไปใช้ นอกจากจะต้องใช้เวลาในการของ Licensing แล้ว ยังต้องมีค่าใช้จ่าย เช่น disclosure fee, royalty fee เป็นต้น ซึ่งทั้งหมดก็คือต้นทุนทั้งสิ้น อย่างไรก็ตาม Apple ยังสามารถคงความเป็นผู้นำด้านต้นทุนด้วยการกำจัด waste ของกระบวนการผลิต, การเพิ่ม productivity ด้วยแนวคิดต่างๆ เช่น Total Quality Management (TQM) หรือ Just In Time (JIT) หรือ Supply Chain Management เป็นต้น
5.2 Differentiation; application นี้ แสดงให้เห็นอย่างชัดเจนถึง market research และนำ voice of customer มา Research & Development เพื่อสร้าง application ที่สามารถตอบสนองความต้องการของผู้ใช้ iPhone ทำให้กลายเป็นจุดแข็งที่ไม่สามารถลอกเลียนแบบได้ และทำให้ผลิตภัณฑ์มีความแตกต่างและมีจุดเด่นจากคู่แข่งอย่างชัดเจน ดังนั้นเมื่อลูกค้านึกถึง application นี้เมื่อไหร่ ก็จะนึกถึง iPhone เป็นอันดับแรก ซึ่งนั่นแสดงถึงการสร้าง customer royalty และ brand image ดังที่กล่าวไว้ในข้อ 3 และ 4 ตามลำดับ

References
1. http://www.patentlyapple.com/patently-apple/2011/05/apple-to-advance-iphone-with-both-text-to-speech-speech-to-text-converters.html
2. http://news.cnet.com/8301-31021_3-20062803-260.html
3. http://www.mobilecrunch.com/2011/05/16/apple-files-text-to-speechspeech-to-text-patent-for-phone-calls/
4. http://www.siamgizmo.com/2011/05/apple

นายสุขุมา ชยานนท์ 5320221006