By pittawat Contributor on Tag: SCB 10X, Typhoon, OCR, VLM

ทีม Typhoon จาก SCB 10X เปิดตัวโมเดล OCR สำหรับดึงข้อมูลจากรูปภาพและเอกสาร PDF ชื่อ Typhoon OCR ชูจุดเด่นเข้าใจทั้งภาษาไทยและภาษาอังกฤษ โดยมีประสิทธิภาพในภาษาไทยที่เหนือกว่า GPT-4o และ Gemini 2.5 Flash

โดยเบื้องหลังใช้สถาปัตยกรรมเป็น Vision Language Model (VLM) ซึ่งเข้าใจทั้งภาษาและรูปภาพ ขนาด 7 พันล้านพารามิเตอร์ พัฒนาต่อยอดจาก Qwen2.5-VL-7B-Instruct และได้รับแรงบันดาลใจจากแนวทางอย่าง olmOCR ซึ่งร่วมใช้ข้อมูล metadata จากไฟล์ PDF ในระหว่างการดึงข้อมูล

Typhoon OCR รองรับการดึงข้อมูลจากเอกสารที่มีความซับซ้อนอย่างงบการเงิน อินโฟกราฟิก และเอกสารราชการได้ รวมถึงรองรับตัวเลขไทย

By arjin Writer on Tag: Mistral, Artificial Intelligence, API, OCR
Mistral

Mistral เปิดตัว Mistral OCR ที่เป็น API ให้นักพัฒนาใช้ดำเนินการอ่านข้อมูลจากเอกสาร PDF ที่มาในรูปแบบแตกต่างกันไป เพื่อแปลงออกมาเป็นฟอร์แมตที่ง่ายขึ้นสำหรับให้โมเดลปัญญาประดิษฐ์เรียนรู้ต่อ

Mistral OCR สามารถจัดการข้อมูลอยู่ในเอกสารที่อาจมีหลายรูปแบบทั้งตัวหนังสือ รูปภาพ ตาราง สมการ ให้ออกมาเป็นเอาท์พุทแบบ Markdown ทำให้สามารถจัดการเอกสารต่อได้ตรงกับรูปแบบต้นฉบับมากขึ้น

By lew Founder on Tag: Ai2, LLM, Artificial Intelligence, Qwen, OCR
Ai2

Ai2 สถาบันวิจัยที่ก่อตั้งโดย Paul Allen ผู้ร่วมก่อตั้งไมโครซอฟท์ เปิดตัวโมเดลปัญญาประดิษฐ์ olmOCR โมเดลแปลงภาพเป็นข้อความคุณภาพสูง ทดสอบแบบใช้มนุษย์ตัดสินแล้วดีกว่าโมเดลปัญญาประดิษฐ์ในกลุ่มเดียวกันมาก

olmOCR สร้างจาก Qwen2-VL-7B-Instruct โมเดลขนาดเล็กของ Alibaba Cloud แต่ปรับแต่งโมเดลเพิ่มเติมด้วยการฝึกแปลงภาพเป็นข้อความจากเอกสาร 250,000 ฉบับ

By lew Founder on Tag: Thailand, OCR
Thailand

วันนี้คณะรัฐมนตรีมีมติอนุมัติหลักการให้มีป้ายทะเบียนแบบใหม่ทำให้สามารถจดทะเบียนเป็นคำที่มีสระและวรรณยุกต์ได้ เปิดทางให้ผู้ใช้รถจดทะเบียนรถเป็นคำพูดหรือชื่อได้

ผู้ที่ได้รับกระทบจากความเปลี่ยนแปลงครั้งนี้คงเป็นซอฟต์แวร์อ่านป้ายทะเบียนอัตโนมัติ (license plate recognition - LPR) ที่หลายบริษัทอาจจะจำกัดตัวอักษรไว้เพียงสองตัว และไม่มีซอฟต์แวร์ใดเคยรองรับสระหรือวรรณยุกต์มาก่อน

มตินี้ยังไม่เป็นกฎหมายจริง โดยหลังจากครม.อนุมัติหลักการในวันนี้แล้วจะส่งร่างให้สำนักงานคณะกรรมการกฤษฎีกาตรวจสอบต่อไป

By arjin Writer on Tag: Apple Pencil, iOS 14, Apple, Rumors, OCR, iOS
Apple Pencil

เว็บ MacRumors อ้างข้อมูลที่ได้รับ เผยว่า iOS 14 จะมีคุณสมบัติใหม่สำหรับนักพัฒนาคือ PencilKit โดยสามารถใช้ Apple Pencil ป้อนข้อมูลในอินพุทตัวหนังสือได้ ด้วยการเขียนเป็นลายมือ ซึ่งปัจจุบันคุณสมบัตินี้รองรับในแอป Notes แต่แอปอื่นยังไม่เปิดให้ใช้

เนื่องจากคุณสมบัติใหม่นี้ใช้ชื่อ PencilKit จึงน่าจะเปิดให้นักพัฒนาเข้าถึงการใช้งาน Apple Pencil ด้วยเช่นกัน แต่ยังไม่มีรายละเอียดว่าสามารถเข้าถึงได้มากแค่ไหน

นอกจากการแปลงลายมือเป็นตัวอักษร iOS 14 จะมีฟีเจอร์เรียกว่า Magic Fill โดยเมื่อวาดรูปทรงต่าง ๆ ด้วย Apple Pencil ตัว iOS จะเพิ่มการเติมสีในวัตถุให้

By arjin Writer on Tag: Google Photos, Google Lens, OCR
Google Photos

มีผู้พบฟีเจอร์ใหม่ใน Google Photos ซึ่งต่อมาบัญชีทวิตเตอร์ของ Google Photos ก็ออกมายืนยัน โดยผู้ใช้งานสามารถเสิร์ชค้นหาข้อความที่ปรากฏอยู่ในรูปได้แล้ว จึงเหมาะกับการค้นหาหน้าเอกสาร

นอกจากจะค้นหาได้ เมื่อได้รูปที่ต้องการ ยังสามารถเลือก Lens เพื่อไฮไลท์ข้อความที่ต้องการ แล้วคัดลอกออกมาเป็นตัวหนังสือ เพื่อนำไปวางต่อในแอปอื่นได้อีกด้วย

ฟีเจอร์นี้เริ่มเปิดใช้งานแล้วบนอุปกรณ์ Android บางส่วน ส่วน iOS ยังไม่มีกำหนดว่าจะมีให้ใช้งานเมื่อใด

By nismod Writer on Tag: LINE, OCR, Translation
LINE

หลังเปิดตัวฟีเจอร์ OCR มาตั้งแต่ปลายปีที่แล้วบนเดสก์ท็อป ก่อนจะรองรับภาษาอังกฤษและไทยเมื่อไม่นานมานี้ ล่าสุดฟีเจอร์ OCR ของ LINE สามารถใช้งานบนสมาร์ทโฟนได้แล้วทั้ง iOS และ Android

การใช้งานฟีเจอร์นี้ จะมีทั้งเป็นโหมด OCR เมื่อเปิดกล้อง หรือเลือกให้อ่านข้อความจากรูปภาพที่ส่งกันในแชทก็ได้ โดยเลือกตัวเลือก [T] บริเวณขวาบนเมื่อกดดูรูปแบบเต็มจอ

By nismod Writer on Tag: LINE, OCR, Translation
LINE

LINE เปิดตัวฟีเจอร์ OCR แปลงรูปเป็นข้อความ สำหรับ LINE บนพีซีไปเมื่อปลายปีที่แล้ว โดยรองรับเฉพาะภาษาญี่ปุ่นเท่านั้น

ล่าสุดฟีเจอร์นี้รองรับภาษาอื่นๆ เพิ่มเติมแล้วได้แก่อังกฤษ, ไทย, จีน, เกาหลีและอินโด โดยตัวเลือกเพื่อแปลงข้อความจะสามารถกดเลือกได้จาก 3 จุดคือคลิ๊กขวาที่ภาพ, ตัวเลือกด้านล่างขวาเมื่อกดดูรูปภาพบนหน้าต่างใหม่ และเมื่อกดใช้ Capture Tool จะมีตัวเลือกแปลงเป็นข้อความเพิ่มเข้ามาให้ด้วย

By mk Founder on Tag: LINE, Artificial Intelligence, OCR, Image Recognition
LINE

LINE ประกาศเตรียมขายไลเซนส์เทคโนโลยีด้าน AI ให้บริษัทอื่นๆ ใช้งานด้วย โดยจะเริ่มในช่วงต้นปี 2019

ตัวอย่างเทคโนโลยีด้าน AI ของ LINE คือ text/image recognition รวมถึง OCR โดยเน้นไปที่ภาษาญี่ปุ่นเป็นหลัก เป้าหมายก็เพื่อให้บริษัทอื่นๆ ที่ไม่มีกำลังนักพัฒนาเท่ากับ LINE สามารถตอบสนองลูกค้าผ่านแช็ทบ็อต หรือแปลงข้อความจากภาพเป็น text แล้วนำไปแปลภาษาอัตโนมัติ

การขายไลเซนส์ของ LINE จะไม่บังคับให้ต้องเชื่อมต่อแอพกับ LINE ด้วย แต่ LINE ก็มองว่าการเปิดเทคโนโลยีให้บริษัทอื่นๆ ใช้งานจะช่วยเร่งการพัฒนาของตัวเอง รวมถึงสร้างรายได้เข้าบริษัทได้อีกช่องทางหนึ่ง

By mk Founder on Tag: LINE, OCR, Translation
LINE

LINE เปิดตัวฟีเจอร์ OCR แปลงรูปภาพเป็นข้อความ อำนวยความสะดวกไม่ต้องพิมพ์เอง แถมนำข้อความไปใช้งานอื่นๆ เช่น แปลภาษาได้ทันที ตอนนี้เปิดใช้สำหรับ LINE เวอร์ชันเดสก์ท็อปแล้ว

ฟีเจอร์ OCR สามารถแปลงข้อความรูปภาพออกมาเป็น text ได้โดยตรง วิธีใช้งานคือจะมีปุ่มสำหรับลากพื้นที่บนหน้าจอที่ต้องการ OCR แล้วจะมีหน้าต่างใหม่ที่แสดงผลลัพธ์ออกมาให้ทันที

By Job_The_Gamer Writer on Tag: Microsoft Office, Mobile App, iOS, Android, OCR, Microsoft
Microsoft Office

ไมโครซอฟท์ออกอัพเดตให้กับ Office Lens แอพถ่ายภาพเพื่อใช้แปลงเป็นเอกสาร โดยได้เพิ่มความสามารถใหม่ให้ทั้งบน iOS และ Android มีรายละเอียดดังนี้

ฟีเจอร์ใหม่บน iOS

  • เพิ่มตัวเลือกให้สามารถเขียนข้อความลงในเอกสารได้
By Job_The_Gamer Writer on Tag: Microsoft Office, Mobile App, iOS, Android, OCR, Microsoft
Microsoft Office

ไมโครซอฟท์ออกอัพเดตให้กับ Office Lens บน iOS และ Android แอพถ่ายภาพแล้วแปลงเป็นเอกสาร โดยได้เปิดให้สามารถเลือกบันทึกเอกสารที่อยู่ในฟอร์แมตไฟล์ PDF เข้าตัวอุปกรณ์โดยตรง ไม่ถูกจำกัดว่าจะต้องบันทึกเข้า OneDrive เท่านั้น

ทำให้ผู้ใช้ Office Lens ที่ต้องการเพียงแค่ไฟล์ PDF ไม่จำเป็นต้อง log in บนแอพก่อนการเซฟไฟล์อีกต่อไป และช่วยให้ยังสามารถใช้ Office Lens ได้แม้ว่าจะไม่ได้เชื่อมต่ออินเทอร์เน็ต

ดาวน์โหลด Office Lens เวอร์ชันล่าสุดได้แล้วที่ App Store และ Google Play ครับ

ที่มา - ทวิตเตอร์ @OfficeNews, MSPoweruser

By Job_The_Gamer Writer on Tag: Microsoft Office, Mobile App, Android, OCR, Microsoft
Microsoft Office

ไมโครซอฟท์ออกอัพเดตให้กับ Office Lens บน Android แอพถ่ายภาพแล้วแปลงออกมาเป็นเอกสารโดยได้เพิ่มความสามารถในการสแกนภาพทีละหลายๆ ภาพเพื่อรวบรวมและบันทึกออกมาเป็นเอกสารชุดเดียว

ช่วยให้ผู้ใช้ Office Lens บน Android ไม่ต้องคอยรวมไฟล์เอกสารแต่ละหน้าซึ่งแต่ก่อนจะถูกบันทึกแยกกันอีกต่อไป และยังคงสามารถเลือกฟอร์แมตของไฟล์ที่เซฟได้ทั้ง Word, PowerPoint และ PDF หรือจะเลือกบันทึกเข้า OneNote ก็ทำได้

ท่านใดสนใจเข้าไปดาวน์โหลด Office Lens for Android เวอร์ชันล่าสุดได้แล้วที่ Google Play ครับ

ที่มา - ทวิตเตอร์ @OfficeNews, MSPoweruser

By mk Founder on Tag: Google Translate, Translation, OCR, Japan
Google Translate

Word Lens ฟีเจอร์ใช้กล้องถ่ายภาพเพื่อแปลภาษาของ Google Translate รองรับการแปลข้อความภาษาญี่ปุ่นเป็นภาษาอังกฤษแล้ว ช่วยให้คนที่เดินทางไปเที่ยวประเทศญี่ปุ่น สามารถยกมือถือขึ้นมาแปลป้ายได้อย่างง่ายๆ

ฟีเจอร์นี้สามารถทำงานแบบออฟไลน์ได้ด้วย โดยเราต้องดาวน์โหลดฐานข้อมูลคำแปลมาเก็บไว้ในเครื่องในการใช้งานครั้งแรกก่อน

ตอนนี้ฟีเจอร์นี้ใช้งานได้แล้ว เพียงแค่อัพเดตแอพ Google Translate เป็นเวอร์ชันล่าสุด เลือกให้แปล Japanese เป็น English แล้วกดปุ่มกล้องในตัวแอพได้เลย

By mk Founder on Tag: Android, OCR, Mobile App, Microsoft, Microsoft Office
Android

แอพถ่ายภาพแล้วแปลงเป็นเอกสาร มีให้ดาวน์โหลดบน Windows Phone มาได้สักพักใหญ่ๆ ตามด้วยเวอร์ชัน iOS เมื่อไม่นานมานี้ ฝั่งของ Android หลังจากทดสอบแบบพรีวิวมานานเกือบสองเดือน ก็เปิดให้คนทั่วไปดาวน์โหลดแล้ว

By nuntawat Writer on Tag: OCR, Mobile App, iPad, OneNote, Microsoft
OCR

ไมโครซอฟท์ได้อัพเดตแอพ OneNote for iPad ให้รองรับการจดบันทึกหรือวาดรูปโดยใช้นิ้วหรือสไตลัสแล้ว โดยมีทั้งปากกา ปากกาเมจิก (marker) และปากกาเน้นข้อความ (highlighter) ให้เลือกใช้ แอพ OneNote รุ่นใหม่นี้ยังมีระบบตรวจจับฝ่ามือขณะใช้สไตลัสวาดเขียน ทำให้ผู้ใช้สามารถวางฝ่ามือในท่าทางต่างๆ (ดูภาพท้ายข่าวประกอบ) ขณะวาดเขียนได้โดยสะดวก

OCR

ไมโครซอฟท์มีแอพชื่อ Office Lens บน Windows Phone ใช้สำหรับถ่ายภาพเอกสารแล้วแปลงเป็นโน้ตของ OneNote (ข่าวเก่า) ล่าสุดไมโครซอฟท์อัพเกรดความสามารถของมันเพิ่มเติม ให้สามารถถ่ายภาพเอกสารแล้วแปลงเป็นไฟล์ Word หรือ PowerPoint ได้ด้วย

หลักการทำงานของมันคือใช้เทคนิค image processing ช่วยแปลงเอกสารที่อาจถ่ายมุมเอียง กลับมาเป็นเอกสารที่ถูกสแกนมาแบบแนวราบ จากนั้นใช้เทคนิค OCR แปลงข้อความบนเอกสารเป็นไฟล์ข้อความ โดยยังคงรักษาฟอร์แมตของเอกสารเอาไว้ (ทำได้แม้กระทั่งตาราง) แนะนำให้ดูภาพและวิดีโอประกอบ

By ipats Contributor on Tag: Browser, Chrome, OCR, Extension
Browser

เคยไหม? เจอปัญหาเล่นอินเทอร์เน็ตอยู่แล้วเจอภาพที่มีข้อความน่าสนใจอยากก็อปปี้ไปค้นข้อมูลต่อ ถ้าสั้นๆ ไม่กี่คำ เราก็อาจจะพิมพ์ใหม่ได้ไม่เสียเวลามากแต่ถ้ายาวเป็นประโยคก็อาจจะเหนื่อยหน่อย หรือเจอข้อความภาษาที่ไม่คุ้นอยู่ในภาพจะเอาไปแปลก็ไม่รู้จะพิมพ์อย่างไร

By nuntawat Writer on Tag: OCR, Bing, SkyDrive, Windows 8.1, Microsoft
OCR

หลังจากไมโครซอฟท์เพิ่มฟีเจอร์แปลงภาพเป็นข้อความ (OCR) บน SkyDrive โดยใช้เทคโนโลยีจาก Bing เมื่อเดือนก่อน ล่าสุดบริษัทประกาศว่ากำลังปล่อยฟีเจอร์ใหม่บน Smart Search (หรือบางคนเรียก Universal Search) ที่เพิ่มเข้ามาใน Windows 8.1 ให้ผู้ใช้สามารถค้นหาข้อความบนรูปภาพที่เก็บอยู่ในโฟลเดอร์ Camera Roll บน SkyDrive ได้ เมื่อพบข้อความนั้นก็จะแสดงผลภาพที่มีข้อความดังกล่าว

ที่มา: Inside SkyDrive

By mk Founder on Tag: OCR, Bing, SkyDrive, Microsoft
OCR

ไมโครซอฟท์ยังเดินหน้าเพิ่มฟีเจอร์ให้ SkyDrive อย่างต่อเนื่อง ล่าสุดประกาศว่ารูปภาพที่เราเก็บใน SkyDrive สามารถถูกแปลงมาเป็นข้อความโดยเทคโนโลยี optical character recognition (OCR)

เทคโนโลยีนี้มาจากทีม Bing และจะถูกเรียกใช้เฉพาะ SkyDrive.com เวอร์ชันเว็บเท่านั้น (ตั้งให้ซิงก์ภาพจากมือถือเก็บลง SkyDrive แล้วไปเปิดดูในเว็บได้) ตอนนี้ยังรองรับเฉพาะภาษาอังกฤษ สเปน โปรตุเกส ฝรั่งเศส และเยอรมนีครับ

Subscribe to OCR