OCR | Blognone

Typhoon เปิดตัวโมเดล OCR สำหรับดึงข้อมูลจากเอกสารและรูปภาพ รองรับภาษาไทยและอังกฤษ

By pittawat

on 20 May 2025 - 22:54 Tag: SCB 10X, Typhoon, OCR, VLM

ทีม Typhoon จาก SCB 10X เปิดตัวโมเดล OCR สำหรับดึงข้อมูลจากรูปภาพและเอกสาร PDF ชื่อ Typhoon OCR ชูจุดเด่นเข้าใจทั้งภาษาไทยและภาษาอังกฤษ โดยมีประสิทธิภาพในภาษาไทยที่เหนือกว่า GPT-4o และ Gemini 2.5 Flash

โดยเบื้องหลังใช้สถาปัตยกรรมเป็น Vision Language Model (VLM) ซึ่งเข้าใจทั้งภาษาและรูปภาพ ขนาด 7 พันล้านพารามิเตอร์ พัฒนาต่อยอดจาก Qwen2.5-VL-7B-Instruct และได้รับแรงบันดาลใจจากแนวทางอย่าง olmOCR ซึ่งร่วมใช้ข้อมูล metadata จากไฟล์ PDF ในระหว่างการดึงข้อมูล

Typhoon OCR รองรับการดึงข้อมูลจากเอกสารที่มีความซับซ้อนอย่างงบการเงิน อินโฟกราฟิก และเอกสารราชการได้ รวมถึงรองรับตัวเลขไทย

Mistral ออก API Mistral OCR อ่านข้อมูลจากเอกสาร PDF เป็น Markdown ได้ดีกว่าโมเดล OCR อื่น

By arjin

on 7 March 2025 - 18:31 Tag: Mistral, Artificial Intelligence, API, OCR

Mistral

Mistral เปิดตัว Mistral OCR ที่เป็น API ให้นักพัฒนาใช้ดำเนินการอ่านข้อมูลจากเอกสาร PDF ที่มาในรูปแบบแตกต่างกันไป เพื่อแปลงออกมาเป็นฟอร์แมตที่ง่ายขึ้นสำหรับให้โมเดลปัญญาประดิษฐ์เรียนรู้ต่อ

Mistral OCR สามารถจัดการข้อมูลอยู่ในเอกสารที่อาจมีหลายรูปแบบทั้งตัวหนังสือ รูปภาพ ตาราง สมการ ให้ออกมาเป็นเอาท์พุทแบบ Markdown ทำให้สามารถจัดการเอกสารต่อได้ตรงกับรูปแบบต้นฉบับมากขึ้น

สถาบันวิจัย Ai2 เปิดตัว olmOCR โมเดลแปลงภาพเป็นข้อความคุณภาพสูง ใช้ภาษาไทยได้

By lew

on 28 February 2025 - 00:55 Tag: Ai2, LLM, Artificial Intelligence, Qwen, OCR

Ai2

Ai2 สถาบันวิจัยที่ก่อตั้งโดย Paul Allen ผู้ร่วมก่อตั้งไมโครซอฟท์ เปิดตัวโมเดลปัญญาประดิษฐ์ olmOCR โมเดลแปลงภาพเป็นข้อความคุณภาพสูง ทดสอบแบบใช้มนุษย์ตัดสินแล้วดีกว่าโมเดลปัญญาประดิษฐ์ในกลุ่มเดียวกันมาก

olmOCR สร้างจาก Qwen2-VL-7B-Instruct โมเดลขนาดเล็กของ Alibaba Cloud แต่ปรับแต่งโมเดลเพิ่มเติมด้วยการฝึกแปลงภาพเป็นข้อความจากเอกสาร 250,000 ฉบับ

เตรียมอัพเดตโปรแกรม ครม.เห็นชอบป้ายทะเบียนรถแบบใหม่ มีสระและวรรณยุกต์ได้

By lew

on 2 February 2021 - 15:22 Tag: Thailand, OCR

Thailand

วันนี้คณะรัฐมนตรีมีมติอนุมัติหลักการให้มีป้ายทะเบียนแบบใหม่ทำให้สามารถจดทะเบียนเป็นคำที่มีสระและวรรณยุกต์ได้ เปิดทางให้ผู้ใช้รถจดทะเบียนรถเป็นคำพูดหรือชื่อได้

ผู้ที่ได้รับกระทบจากความเปลี่ยนแปลงครั้งนี้คงเป็นซอฟต์แวร์อ่านป้ายทะเบียนอัตโนมัติ (license plate recognition - LPR) ที่หลายบริษัทอาจจะจำกัดตัวอักษรไว้เพียงสองตัว และไม่มีซอฟต์แวร์ใดเคยรองรับสระหรือวรรณยุกต์มาก่อน

มตินี้ยังไม่เป็นกฎหมายจริง โดยหลังจากครม.อนุมัติหลักการในวันนี้แล้วจะส่งร่างให้สำนักงานคณะกรรมการกฤษฎีกาตรวจสอบต่อไป

[ลือ] iOS 14 จะมี PencilKit นักพัฒนาภายนอกใช้ Apple Pencil แปลงลายมือเป็นตัวหนังสือได้

By arjin

on 10 March 2020 - 12:27 Tag: Apple Pencil, iOS 14, Apple, Rumors, OCR, iOS

Apple Pencil

เว็บ MacRumors อ้างข้อมูลที่ได้รับ เผยว่า iOS 14 จะมีคุณสมบัติใหม่สำหรับนักพัฒนาคือ PencilKit โดยสามารถใช้ Apple Pencil ป้อนข้อมูลในอินพุทตัวหนังสือได้ ด้วยการเขียนเป็นลายมือ ซึ่งปัจจุบันคุณสมบัตินี้รองรับในแอป Notes แต่แอปอื่นยังไม่เปิดให้ใช้

เนื่องจากคุณสมบัติใหม่นี้ใช้ชื่อ PencilKit จึงน่าจะเปิดให้นักพัฒนาเข้าถึงการใช้งาน Apple Pencil ด้วยเช่นกัน แต่ยังไม่มีรายละเอียดว่าสามารถเข้าถึงได้มากแค่ไหน

นอกจากการแปลงลายมือเป็นตัวอักษร iOS 14 จะมีฟีเจอร์เรียกว่า Magic Fill โดยเมื่อวาดรูปทรงต่าง ๆ ด้วย Apple Pencil ตัว iOS จะเพิ่มการเติมสีในวัตถุให้

Google Photos เพิ่มฟีเจอร์ใหม่ ค้นหาข้อความในรูปภาพ และ Copy ข้อความออกมาได้

By arjin

on 23 August 2019 - 12:25 Tag: Google Photos, Google Lens, OCR

Google Photos

มีผู้พบฟีเจอร์ใหม่ใน Google Photos ซึ่งต่อมาบัญชีทวิตเตอร์ของ Google Photos ก็ออกมายืนยัน โดยผู้ใช้งานสามารถเสิร์ชค้นหาข้อความที่ปรากฏอยู่ในรูปได้แล้ว จึงเหมาะกับการค้นหาหน้าเอกสาร

นอกจากจะค้นหาได้ เมื่อได้รูปที่ต้องการ ยังสามารถเลือก Lens เพื่อไฮไลท์ข้อความที่ต้องการ แล้วคัดลอกออกมาเป็นตัวหนังสือ เพื่อนำไปวางต่อในแอปอื่นได้อีกด้วย

ฟีเจอร์นี้เริ่มเปิดใช้งานแล้วบนอุปกรณ์ Android บางส่วน ส่วน iOS ยังไม่มีกำหนดว่าจะมีให้ใช้งานเมื่อใด

LINE บนมือถือรองรับฟีเจอร์ OCR แปลงรูปเป็นข้อความแล้ว พร้อมแปลภาษาให้ในตัว

By nismod

on 14 May 2019 - 11:02 Tag: LINE, OCR, Translation

LINE

หลังเปิดตัวฟีเจอร์ OCR มาตั้งแต่ปลายปีที่แล้วบนเดสก์ท็อป ก่อนจะรองรับภาษาอังกฤษและไทยเมื่อไม่นานมานี้ ล่าสุดฟีเจอร์ OCR ของ LINE สามารถใช้งานบนสมาร์ทโฟนได้แล้วทั้ง iOS และ Android

การใช้งานฟีเจอร์นี้ จะมีทั้งเป็นโหมด OCR เมื่อเปิดกล้อง หรือเลือกให้อ่านข้อความจากรูปภาพที่ส่งกันในแชทก็ได้ โดยเลือกตัวเลือก [T] บริเวณขวาบนเมื่อกดดูรูปแบบเต็มจอ

ฟีเจอร์ OCR แปลงรูปเป็นข้อความบน LINE พีซี รองรับภาษาอังกฤษและไทยแล้ว

By nismod

on 12 February 2019 - 13:08 Tag: LINE, OCR, Translation

LINE

LINE เปิดตัวฟีเจอร์ OCR แปลงรูปเป็นข้อความ สำหรับ LINE บนพีซีไปเมื่อปลายปีที่แล้ว โดยรองรับเฉพาะภาษาญี่ปุ่นเท่านั้น

ล่าสุดฟีเจอร์นี้รองรับภาษาอื่นๆ เพิ่มเติมแล้วได้แก่อังกฤษ, ไทย, จีน, เกาหลีและอินโด โดยตัวเลือกเพื่อแปลงข้อความจะสามารถกดเลือกได้จาก 3 จุดคือคลิ๊กขวาที่ภาพ, ตัวเลือกด้านล่างขวาเมื่อกดดูรูปภาพบนหน้าต่างใหม่ และเมื่อกดใช้ Capture Tool จะมีตัวเลือกแปลงเป็นข้อความเพิ่มเข้ามาให้ด้วย

LINE เตรียมเปิดเทคโนโลยีด้าน AI / OCR ให้บริษัทอื่นๆ ใช้งาน

By mk

on 2 January 2019 - 10:42 Tag: LINE, Artificial Intelligence, OCR, Image Recognition

LINE

LINE ประกาศเตรียมขายไลเซนส์เทคโนโลยีด้าน AI ให้บริษัทอื่นๆ ใช้งานด้วย โดยจะเริ่มในช่วงต้นปี 2019

ตัวอย่างเทคโนโลยีด้าน AI ของ LINE คือ text/image recognition รวมถึง OCR โดยเน้นไปที่ภาษาญี่ปุ่นเป็นหลัก เป้าหมายก็เพื่อให้บริษัทอื่นๆ ที่ไม่มีกำลังนักพัฒนาเท่ากับ LINE สามารถตอบสนองลูกค้าผ่านแช็ทบ็อต หรือแปลงข้อความจากภาพเป็น text แล้วนำไปแปลภาษาอัตโนมัติ

การขายไลเซนส์ของ LINE จะไม่บังคับให้ต้องเชื่อมต่อแอพกับ LINE ด้วย แต่ LINE ก็มองว่าการเปิดเทคโนโลยีให้บริษัทอื่นๆ ใช้งานจะช่วยเร่งการพัฒนาของตัวเอง รวมถึงสร้างรายได้เข้าบริษัทได้อีกช่องทางหนึ่ง

ไม่ต้องพิมพ์เอง LINE เพิ่มฟีเจอร์ OCR แปลงรูปเป็นข้อความ แปลภาษาได้ ใช้บนเดสก์ท็อปได้แล้ว

By mk

on 21 November 2018 - 09:52 Tag: LINE, OCR, Translation

LINE

LINE เปิดตัวฟีเจอร์ OCR แปลงรูปภาพเป็นข้อความ อำนวยความสะดวกไม่ต้องพิมพ์เอง แถมนำข้อความไปใช้งานอื่นๆ เช่น แปลภาษาได้ทันที ตอนนี้เปิดใช้สำหรับ LINE เวอร์ชันเดสก์ท็อปแล้ว

ฟีเจอร์ OCR สามารถแปลงข้อความรูปภาพออกมาเป็น text ได้โดยตรง วิธีใช้งานคือจะมีปุ่มสำหรับลากพื้นที่บนหน้าจอที่ต้องการ OCR แล้วจะมีหน้าต่างใหม่ที่แสดงผลลัพธ์ออกมาให้ทันที

แอพ Office Lens ได้รับอัพเดต, Android เลือกและตัดขอบเอกสารได้ง่ายขึ้น / iOS เขียนข้อความตกแต่งเอกสารได้แล้ว

By Job_The_Gamer

on 27 October 2018 - 22:29 Tag: Microsoft Office, Mobile App, iOS, Android, OCR, Microsoft

Microsoft Office

ไมโครซอฟท์ออกอัพเดตให้กับ Office Lens แอพถ่ายภาพเพื่อใช้แปลงเป็นเอกสาร โดยได้เพิ่มความสามารถใหม่ให้ทั้งบน iOS และ Android มีรายละเอียดดังนี้

ฟีเจอร์ใหม่บน iOS

เพิ่มตัวเลือกให้สามารถเขียนข้อความลงในเอกสารได้

แอพ Office Lens สำหรับ iOS และ Android ได้รับอัพเดต, ไม่ต้อง log in ก็บันทึกไฟล์ PDF ได้

By Job_The_Gamer

on 16 December 2017 - 09:06 Tag: Microsoft Office, Mobile App, iOS, Android, OCR, Microsoft

Microsoft Office

ไมโครซอฟท์ออกอัพเดตให้กับ Office Lens บน iOS และ Android แอพถ่ายภาพแล้วแปลงเป็นเอกสาร โดยได้เปิดให้สามารถเลือกบันทึกเอกสารที่อยู่ในฟอร์แมตไฟล์ PDF เข้าตัวอุปกรณ์โดยตรง ไม่ถูกจำกัดว่าจะต้องบันทึกเข้า OneDrive เท่านั้น

ทำให้ผู้ใช้ Office Lens ที่ต้องการเพียงแค่ไฟล์ PDF ไม่จำเป็นต้อง log in บนแอพก่อนการเซฟไฟล์อีกต่อไป และช่วยให้ยังสามารถใช้ Office Lens ได้แม้ว่าจะไม่ได้เชื่อมต่ออินเทอร์เน็ต

ดาวน์โหลด Office Lens เวอร์ชันล่าสุดได้แล้วที่ App Store และ Google Play ครับ

ที่มา - ทวิตเตอร์ @OfficeNews, MSPoweruser

ไมโครซอฟท์อัพเดต Office Lens for Android สแกนเอกสารได้ทีละหลายหน้า

By Job_The_Gamer

on 28 August 2017 - 00:37 Tag: Microsoft Office, Mobile App, Android, OCR, Microsoft

Microsoft Office

ไมโครซอฟท์ออกอัพเดตให้กับ Office Lens บน Android แอพถ่ายภาพแล้วแปลงออกมาเป็นเอกสารโดยได้เพิ่มความสามารถในการสแกนภาพทีละหลายๆ ภาพเพื่อรวบรวมและบันทึกออกมาเป็นเอกสารชุดเดียว

ช่วยให้ผู้ใช้ Office Lens บน Android ไม่ต้องคอยรวมไฟล์เอกสารแต่ละหน้าซึ่งแต่ก่อนจะถูกบันทึกแยกกันอีกต่อไป และยังคงสามารถเลือกฟอร์แมตของไฟล์ที่เซฟได้ทั้ง Word, PowerPoint และ PDF หรือจะเลือกบันทึกเข้า OneNote ก็ทำได้

ท่านใดสนใจเข้าไปดาวน์โหลด Office Lens for Android เวอร์ชันล่าสุดได้แล้วที่ Google Play ครับ

ที่มา - ทวิตเตอร์ @OfficeNews, MSPoweruser

แปลป้ายภาษาญี่ปุ่นจากกล้องมือถือด้วย Google Translate ได้แล้ว แปลออฟไลน์ได้

By mk

on 27 January 2017 - 08:22 Tag: Google Translate, Translation, OCR, Japan

Google Translate

Word Lens ฟีเจอร์ใช้กล้องถ่ายภาพเพื่อแปลภาษาของ Google Translate รองรับการแปลข้อความภาษาญี่ปุ่นเป็นภาษาอังกฤษแล้ว ช่วยให้คนที่เดินทางไปเที่ยวประเทศญี่ปุ่น สามารถยกมือถือขึ้นมาแปลป้ายได้อย่างง่ายๆ

ฟีเจอร์นี้สามารถทำงานแบบออฟไลน์ได้ด้วย โดยเราต้องดาวน์โหลดฐานข้อมูลคำแปลมาเก็บไว้ในเครื่องในการใช้งานครั้งแรกก่อน

ตอนนี้ฟีเจอร์นี้ใช้งานได้แล้ว เพียงแค่อัพเดตแอพ Google Translate เป็นเวอร์ชันล่าสุด เลือกให้แปล Japanese เป็น English แล้วกดปุ่มกล้องในตัวแอพได้เลย

ไมโครซอฟท์เปิดให้ดาวน์โหลด Office Lens for Android แล้ว

By mk

on 28 May 2015 - 08:17 Tag: Android, OCR, Mobile App, Microsoft, Microsoft Office

Android

แอพถ่ายภาพแล้วแปลงเป็นเอกสาร มีให้ดาวน์โหลดบน Windows Phone มาได้สักพักใหญ่ๆ ตามด้วยเวอร์ชัน iOS เมื่อไม่นานมานี้ ฝั่งของ Android หลังจากทดสอบแบบพรีวิวมานานเกือบสองเดือน ก็เปิดให้คนทั่วไปดาวน์โหลดแล้ว

OneNote for iPad รองรับการจดด้วยลายมือ, OneNote ทุกแพลตฟอร์มรองรับการค้นหาข้อความในภาพ

By nuntawat

on 20 February 2015 - 06:22 Tag: OCR, Mobile App, iPad, OneNote, Microsoft

OCR

ไมโครซอฟท์ได้อัพเดตแอพ OneNote for iPad ให้รองรับการจดบันทึกหรือวาดรูปโดยใช้นิ้วหรือสไตลัสแล้ว โดยมีทั้งปากกา ปากกาเมจิก (marker) และปากกาเน้นข้อความ (highlighter) ให้เลือกใช้ แอพ OneNote รุ่นใหม่นี้ยังมีระบบตรวจจับฝ่ามือขณะใช้สไตลัสวาดเขียน ทำให้ผู้ใช้สามารถวางฝ่ามือในท่าทางต่างๆ (ดูภาพท้ายข่าวประกอบ) ขณะวาดเขียนได้โดยสะดวก

ไมโครซอฟท์ออก Office Lens ถ่ายภาพเอกสารแล้วแปลงเป็นไฟล์ Word ทันที

By mk

on 18 September 2014 - 23:47 Tag: OCR, Windows Phone, Image Processing, Microsoft Word, PowerPoint, Microsoft, Microsoft Office

OCR

ไมโครซอฟท์มีแอพชื่อ Office Lens บน Windows Phone ใช้สำหรับถ่ายภาพเอกสารแล้วแปลงเป็นโน้ตของ OneNote (ข่าวเก่า) ล่าสุดไมโครซอฟท์อัพเกรดความสามารถของมันเพิ่มเติม ให้สามารถถ่ายภาพเอกสารแล้วแปลงเป็นไฟล์ Word หรือ PowerPoint ได้ด้วย

หลักการทำงานของมันคือใช้เทคนิค image processing ช่วยแปลงเอกสารที่อาจถ่ายมุมเอียง กลับมาเป็นเอกสารที่ถูกสแกนมาแบบแนวราบ จากนั้นใช้เทคนิค OCR แปลงข้อความบนเอกสารเป็นไฟล์ข้อความ โดยยังคงรักษาฟอร์แมตของเอกสารเอาไว้ (ทำได้แม้กระทั่งตาราง) แนะนำให้ดูภาพและวิดีโอประกอบ

Naptha ส่วนขยายเบราว์เซอร์สำหรับช่วยสกัดข้อความออกจากรูปภาพ

By ipats

on 24 April 2014 - 04:04 Tag: Browser, Chrome, OCR, Extension

Browser

เคยไหม? เจอปัญหาเล่นอินเทอร์เน็ตอยู่แล้วเจอภาพที่มีข้อความน่าสนใจอยากก็อปปี้ไปค้นข้อมูลต่อ ถ้าสั้นๆ ไม่กี่คำ เราก็อาจจะพิมพ์ใหม่ได้ไม่เสียเวลามากแต่ถ้ายาวเป็นประโยคก็อาจจะเหนื่อยหน่อย หรือเจอข้อความภาษาที่ไม่คุ้นอยู่ในภาพจะเอาไปแปลก็ไม่รู้จะพิมพ์อย่างไร

Bing บน Windows 8.1 จะสามารถค้นหาข้อความบนรูปภาพที่เก็บอยู่บน SkyDrive ได้

By nuntawat

on 8 October 2013 - 07:52 Tag: OCR, Bing, SkyDrive, Windows 8.1, Microsoft

OCR

หลังจากไมโครซอฟท์เพิ่มฟีเจอร์แปลงภาพเป็นข้อความ (OCR) บน SkyDrive โดยใช้เทคโนโลยีจาก Bing เมื่อเดือนก่อน ล่าสุดบริษัทประกาศว่ากำลังปล่อยฟีเจอร์ใหม่บน Smart Search (หรือบางคนเรียก Universal Search) ที่เพิ่มเข้ามาใน Windows 8.1 ให้ผู้ใช้สามารถค้นหาข้อความบนรูปภาพที่เก็บอยู่ในโฟลเดอร์ Camera Roll บน SkyDrive ได้ เมื่อพบข้อความนั้นก็จะแสดงผลภาพที่มีข้อความดังกล่าว

ที่มา: Inside SkyDrive

SkyDrive เพิ่มฟีเจอร์แปลงภาพเป็นข้อความ (OCR) โดยใช้เทคโนโลยีจาก Bing

By mk

on 29 August 2013 - 22:36 Tag: OCR, Bing, SkyDrive, Microsoft

OCR

ไมโครซอฟท์ยังเดินหน้าเพิ่มฟีเจอร์ให้ SkyDrive อย่างต่อเนื่อง ล่าสุดประกาศว่ารูปภาพที่เราเก็บใน SkyDrive สามารถถูกแปลงมาเป็นข้อความโดยเทคโนโลยี optical character recognition (OCR)

เทคโนโลยีนี้มาจากทีม Bing และจะถูกเรียกใช้เฉพาะ SkyDrive.com เวอร์ชันเว็บเท่านั้น (ตั้งให้ซิงก์ภาพจากมือถือเก็บลง SkyDrive แล้วไปเปิดดูในเว็บได้) ตอนนี้ยังรองรับเฉพาะภาษาอังกฤษ สเปน โปรตุเกส ฝรั่งเศส และเยอรมนีครับ

Subscribe to OCR