Microsoft Seeing AI พร้อมใช้งานบน Android แล้ว
สิ่งที่คุณต้องรู้
- Microsoft เพิ่งเปิดตัวแอป Seeing AI บน Android ซึ่งขยายการเข้าถึงแอปนี้ไปยังผู้คนอีก 3 พันล้านคน
- การมองเห็น AI ใช้ปัญญาประดิษฐ์เพื่อช่วยเหลือชุมชนคนตาบอดและผู้มีสายตาเลือนราง
- แอปสามารถทำงานต่างๆ เช่น การระบุสกุลเงิน อ่านลายมือ อธิบายฉาก และนำทางบุคคลผ่านเอกสาร
Microsoft ทำงานครั้งแรกในแอป Seeing AI เป็นโครงการวิจัยในปี 2560 นับตั้งแต่นั้นมาก็ได้พัฒนาเป็นแอปที่มีคุณลักษณะครบถ้วนที่พร้อมให้บริการแก่สาธารณะ จนถึงขณะนี้ Seeing AI มีให้บริการบน iOS เท่านั้น แต่ตอนนี้สามารถใช้งานได้บน Android ด้วยเช่นกัน ด้วยจำนวนผู้ใช้ Android มากกว่า 3 พันล้านคนทั่วโลก การเปิดตัวครั้งนี้ช่วยขยายขอบเขตการเข้าถึงของแอปได้อย่างมาก
การมองเห็น AI ใช้ปัญญาประดิษฐ์เพื่อช่วยเหลือชุมชนคนตาบอดและผู้มีสายตาเลือนราง สามารถทำงานประจำวันได้ เช่น นำทางผู้อื่นผ่านเอกสารหรือเมนู จดจำธนบัตรสกุลเงิน และระบุรูปภาพ หากต้องการใช้แอป คุณสามารถเล็งกล้องหรือถ่ายรูปได้
ปัจจุบันการเห็น AI รองรับ 18 ภาษา แต่จำนวนนั้นจะเพิ่มขึ้นเป็น 36 ภาษาในปี 2567
คุณสมบัติต่อไปนี้ได้มาถึงเวอร์ชัน iOS ของ Seeing AI แล้วและยังเปิดใช้งานอยู่ด้วย เวอร์ชัน Android ที่เพิ่งเปิดตัว:
- คำอธิบายภาพถ่ายที่สมบูรณ์ยิ่งขึ้น: นอกเหนือจากการให้ข้อมูลสรุปโดยย่อของภาพถ่ายในช่อง Scene แล้ว คุณยังสามารถแตะ 'เพิ่มเติม' ได้แล้ว ข้อมูล' และคำอธิบายที่สมบูรณ์จะถูกสร้างขึ้น รวมถึงรายละเอียดที่มากขึ้นเกี่ยวกับสิ่งที่อยู่ในนั้น ภาพ.
- แชทกับเอกสารของคุณ: หลังจากสแกนเอกสารแล้ว นอกจากจะได้ยินเสียงอ่านออกเสียงแล้ว คุณยังสามารถแชทเพื่อถาม AI ได้อีกด้วย คำถามต่างๆ เช่น เกี่ยวกับรายการในเมนู ราคาของรายการในใบเสร็จ หรือเพื่อสรุปบทความ
เห็น AI | ฟรีที่ Google Play | ฟรีที่ App Store
แอพนี้ใช้ปัญญาประดิษฐ์เพื่อบรรยายโลก สร้างขึ้นสำหรับชุมชนคนตาบอดและผู้มีสายตาเลือนราง และสามารถทำงานต่างๆ เช่น นำทางบุคคลผ่านเอกสาร บรรยายฉาก ระบุตัวบุคคล และจดจำธนบัตร
Microsoft ยังเน้นย้ำถึงคุณสมบัติหลักบางประการของ Seeing AI สำหรับผู้ที่ไม่คุ้นเคยกับแอป:
- สั้นข้อความ: พูดข้อความทันทีที่ปรากฏหน้ากล้อง
- เอกสาร: ให้คำแนะนำด้วยเสียงเพื่อจับภาพหน้าที่พิมพ์ และอ่านออกเสียงเนื้อหาพร้อมกับการจัดรูปแบบต้นฉบับ แชทกับ Seeing AI เพื่อค้นหาข้อมูลอย่างรวดเร็ว
- สินค้า: สแกนบาร์โค้ดโดยใช้เสียงบี๊บเพื่อนำทางคุณ ได้ยินชื่อและข้อมูลแพ็คเกจเมื่อมี
- ฉาก: ฟังคำอธิบายของฉากที่ถ่ายแล้วแตะ "ข้อมูลเพิ่มเติม" เพื่อสร้างคำอธิบายที่สมบูรณ์ สำรวจภาพถ่ายโดยเลื่อนนิ้วไปบนหน้าจอเพื่อฟังตำแหน่งของวัตถุต่างๆ
- ประชากร: ระบุเพื่อนรอบตัวคุณ
- สกุลเงิน: รับรู้ธนบัตร
- สี: ระบุสีที่รับรู้
- ลายมือ: อ่านข้อความที่เขียนด้วยลายมือเหมือนในการ์ดอวยพร (มีให้ใช้งานในบางภาษา)
- แสงสว่าง: สร้างโทนเสียงที่สอดคล้องกับความสว่างโดยรอบ
- รูปภาพในแอปอื่นๆ: แชร์รูปภาพด้วย Seeing AI เพื่อจดจำ
วิดีโอด้านล่างเป็นวิดีโอเมื่อ 4 ปีที่แล้ว แต่แสดงให้เห็นแนวคิดทั่วไปของการมองเห็น AI