By arjin Writer on Tag: Mistral, Artificial Intelligence, API, OCR
Mistral

Mistral เปิดตัว Mistral OCR ที่เป็น API ให้นักพัฒนาใช้ดำเนินการอ่านข้อมูลจากเอกสาร PDF ที่มาในรูปแบบแตกต่างกันไป เพื่อแปลงออกมาเป็นฟอร์แมตที่ง่ายขึ้นสำหรับให้โมเดลปัญญาประดิษฐ์เรียนรู้ต่อ

Mistral OCR สามารถจัดการข้อมูลอยู่ในเอกสารที่อาจมีหลายรูปแบบทั้งตัวหนังสือ รูปภาพ ตาราง สมการ ให้ออกมาเป็นเอาท์พุทแบบ Markdown ทำให้สามารถจัดการเอกสารต่อได้ตรงกับรูปแบบต้นฉบับมากขึ้น

Read more   1 comment  
By lew Founder on Tag: LLM, Artificial Intelligence, Qwen, OCR
LLM

Ai2 สถาบันวิจัยที่ก่อตั้งโดย Paul Allen ผู้ร่วมก่อตั้งไมโครซอฟท์ เปิดตัวโมเดลปัญญาประดิษฐ์ olmOCR โมเดลแปลงภาพเป็นข้อความคุณภาพสูง ทดสอบแบบใช้มนุษย์ตัดสินแล้วดีกว่าโมเดลปัญญาประดิษฐ์ในกลุ่มเดียวกันมาก

olmOCR สร้างจาก Qwen2-VL-7B-Instruct โมเดลขนาดเล็กของ Alibaba Cloud แต่ปรับแต่งโมเดลเพิ่มเติมด้วยการฝึกแปลงภาพเป็นข้อความจากเอกสาร 250,000 ฉบับ

Read more    
By lew Founder on Tag: Thailand, OCR
Thailand

วันนี้คณะรัฐมนตรีมีมติอนุมัติหลักการให้มีป้ายทะเบียนแบบใหม่ทำให้สามารถจดทะเบียนเป็นคำที่มีสระและวรรณยุกต์ได้ เปิดทางให้ผู้ใช้รถจดทะเบียนรถเป็นคำพูดหรือชื่อได้

ผู้ที่ได้รับกระทบจากความเปลี่ยนแปลงครั้งนี้คงเป็นซอฟต์แวร์อ่านป้ายทะเบียนอัตโนมัติ (license plate recognition - LPR) ที่หลายบริษัทอาจจะจำกัดตัวอักษรไว้เพียงสองตัว และไม่มีซอฟต์แวร์ใดเคยรองรับสระหรือวรรณยุกต์มาก่อน

มตินี้ยังไม่เป็นกฎหมายจริง โดยหลังจากครม.อนุมัติหลักการในวันนี้แล้วจะส่งร่างให้สำนักงานคณะกรรมการกฤษฎีกาตรวจสอบต่อไป

Read more   64 comments  
By arjin Writer on Tag: Apple Pencil, iOS 14, Apple, Rumors, OCR, iOS
Apple Pencil

เว็บ MacRumors อ้างข้อมูลที่ได้รับ เผยว่า iOS 14 จะมีคุณสมบัติใหม่สำหรับนักพัฒนาคือ PencilKit โดยสามารถใช้ Apple Pencil ป้อนข้อมูลในอินพุทตัวหนังสือได้ ด้วยการเขียนเป็นลายมือ ซึ่งปัจจุบันคุณสมบัตินี้รองรับในแอป Notes แต่แอปอื่นยังไม่เปิดให้ใช้

เนื่องจากคุณสมบัติใหม่นี้ใช้ชื่อ PencilKit จึงน่าจะเปิดให้นักพัฒนาเข้าถึงการใช้งาน Apple Pencil ด้วยเช่นกัน แต่ยังไม่มีรายละเอียดว่าสามารถเข้าถึงได้มากแค่ไหน

นอกจากการแปลงลายมือเป็นตัวอักษร iOS 14 จะมีฟีเจอร์เรียกว่า Magic Fill โดยเมื่อวาดรูปทรงต่าง ๆ ด้วย Apple Pencil ตัว iOS จะเพิ่มการเติมสีในวัตถุให้

Read more    
By arjin Writer on Tag: Google Photos, Google Lens, OCR
Google Photos

มีผู้พบฟีเจอร์ใหม่ใน Google Photos ซึ่งต่อมาบัญชีทวิตเตอร์ของ Google Photos ก็ออกมายืนยัน โดยผู้ใช้งานสามารถเสิร์ชค้นหาข้อความที่ปรากฏอยู่ในรูปได้แล้ว จึงเหมาะกับการค้นหาหน้าเอกสาร

นอกจากจะค้นหาได้ เมื่อได้รูปที่ต้องการ ยังสามารถเลือก Lens เพื่อไฮไลท์ข้อความที่ต้องการ แล้วคัดลอกออกมาเป็นตัวหนังสือ เพื่อนำไปวางต่อในแอปอื่นได้อีกด้วย

ฟีเจอร์นี้เริ่มเปิดใช้งานแล้วบนอุปกรณ์ Android บางส่วน ส่วน iOS ยังไม่มีกำหนดว่าจะมีให้ใช้งานเมื่อใด

Read more   8 comments  
By nismod Writer on Tag: LINE, OCR, Translation
LINE

หลังเปิดตัวฟีเจอร์ OCR มาตั้งแต่ปลายปีที่แล้วบนเดสก์ท็อป ก่อนจะรองรับภาษาอังกฤษและไทยเมื่อไม่นานมานี้ ล่าสุดฟีเจอร์ OCR ของ LINE สามารถใช้งานบนสมาร์ทโฟนได้แล้วทั้ง iOS และ Android

การใช้งานฟีเจอร์นี้ จะมีทั้งเป็นโหมด OCR เมื่อเปิดกล้อง หรือเลือกให้อ่านข้อความจากรูปภาพที่ส่งกันในแชทก็ได้ โดยเลือกตัวเลือก [T] บริเวณขวาบนเมื่อกดดูรูปแบบเต็มจอ

Read more   3 comments  
By nismod Writer on Tag: LINE, OCR, Translation
LINE

LINE เปิดตัวฟีเจอร์ OCR แปลงรูปเป็นข้อความ สำหรับ LINE บนพีซีไปเมื่อปลายปีที่แล้ว โดยรองรับเฉพาะภาษาญี่ปุ่นเท่านั้น

ล่าสุดฟีเจอร์นี้รองรับภาษาอื่นๆ เพิ่มเติมแล้วได้แก่อังกฤษ, ไทย, จีน, เกาหลีและอินโด โดยตัวเลือกเพื่อแปลงข้อความจะสามารถกดเลือกได้จาก 3 จุดคือคลิ๊กขวาที่ภาพ, ตัวเลือกด้านล่างขวาเมื่อกดดูรูปภาพบนหน้าต่างใหม่ และเมื่อกดใช้ Capture Tool จะมีตัวเลือกแปลงเป็นข้อความเพิ่มเข้ามาให้ด้วย

Read more   4 comments  
By mk Founder on Tag: LINE, Artificial Intelligence, OCR, Image Recognition
LINE

LINE ประกาศเตรียมขายไลเซนส์เทคโนโลยีด้าน AI ให้บริษัทอื่นๆ ใช้งานด้วย โดยจะเริ่มในช่วงต้นปี 2019

ตัวอย่างเทคโนโลยีด้าน AI ของ LINE คือ text/image recognition รวมถึง OCR โดยเน้นไปที่ภาษาญี่ปุ่นเป็นหลัก เป้าหมายก็เพื่อให้บริษัทอื่นๆ ที่ไม่มีกำลังนักพัฒนาเท่ากับ LINE สามารถตอบสนองลูกค้าผ่านแช็ทบ็อต หรือแปลงข้อความจากภาพเป็น text แล้วนำไปแปลภาษาอัตโนมัติ

การขายไลเซนส์ของ LINE จะไม่บังคับให้ต้องเชื่อมต่อแอพกับ LINE ด้วย แต่ LINE ก็มองว่าการเปิดเทคโนโลยีให้บริษัทอื่นๆ ใช้งานจะช่วยเร่งการพัฒนาของตัวเอง รวมถึงสร้างรายได้เข้าบริษัทได้อีกช่องทางหนึ่ง

Read more   3 comments  
By mk Founder on Tag: LINE, OCR, Translation
LINE

LINE เปิดตัวฟีเจอร์ OCR แปลงรูปภาพเป็นข้อความ อำนวยความสะดวกไม่ต้องพิมพ์เอง แถมนำข้อความไปใช้งานอื่นๆ เช่น แปลภาษาได้ทันที ตอนนี้เปิดใช้สำหรับ LINE เวอร์ชันเดสก์ท็อปแล้ว

ฟีเจอร์ OCR สามารถแปลงข้อความรูปภาพออกมาเป็น text ได้โดยตรง วิธีใช้งานคือจะมีปุ่มสำหรับลากพื้นที่บนหน้าจอที่ต้องการ OCR แล้วจะมีหน้าต่างใหม่ที่แสดงผลลัพธ์ออกมาให้ทันที

Read more    
By Job_The_Gamer Writer on Tag: Microsoft Office, Mobile App, iOS, Android, OCR, Microsoft
Microsoft Office

ไมโครซอฟท์ออกอัพเดตให้กับ Office Lens แอพถ่ายภาพเพื่อใช้แปลงเป็นเอกสาร โดยได้เพิ่มความสามารถใหม่ให้ทั้งบน iOS และ Android มีรายละเอียดดังนี้

ฟีเจอร์ใหม่บน iOS

  • เพิ่มตัวเลือกให้สามารถเขียนข้อความลงในเอกสารได้
Read more   3 comments  
By Job_The_Gamer Writer on Tag: Microsoft Office, Mobile App, iOS, Android, OCR, Microsoft
Microsoft Office

ไมโครซอฟท์ออกอัพเดตให้กับ Office Lens บน iOS และ Android แอพถ่ายภาพแล้วแปลงเป็นเอกสาร โดยได้เปิดให้สามารถเลือกบันทึกเอกสารที่อยู่ในฟอร์แมตไฟล์ PDF เข้าตัวอุปกรณ์โดยตรง ไม่ถูกจำกัดว่าจะต้องบันทึกเข้า OneDrive เท่านั้น

ทำให้ผู้ใช้ Office Lens ที่ต้องการเพียงแค่ไฟล์ PDF ไม่จำเป็นต้อง log in บนแอพก่อนการเซฟไฟล์อีกต่อไป และช่วยให้ยังสามารถใช้ Office Lens ได้แม้ว่าจะไม่ได้เชื่อมต่ออินเทอร์เน็ต

ดาวน์โหลด Office Lens เวอร์ชันล่าสุดได้แล้วที่ App Store และ Google Play ครับ

ที่มา - ทวิตเตอร์ @OfficeNews, MSPoweruser

Read more   2 comments  
By Job_The_Gamer Writer on Tag: Microsoft Office, Mobile App, Android, OCR, Microsoft
Microsoft Office

ไมโครซอฟท์ออกอัพเดตให้กับ Office Lens บน Android แอพถ่ายภาพแล้วแปลงออกมาเป็นเอกสารโดยได้เพิ่มความสามารถในการสแกนภาพทีละหลายๆ ภาพเพื่อรวบรวมและบันทึกออกมาเป็นเอกสารชุดเดียว

ช่วยให้ผู้ใช้ Office Lens บน Android ไม่ต้องคอยรวมไฟล์เอกสารแต่ละหน้าซึ่งแต่ก่อนจะถูกบันทึกแยกกันอีกต่อไป และยังคงสามารถเลือกฟอร์แมตของไฟล์ที่เซฟได้ทั้ง Word, PowerPoint และ PDF หรือจะเลือกบันทึกเข้า OneNote ก็ทำได้

ท่านใดสนใจเข้าไปดาวน์โหลด Office Lens for Android เวอร์ชันล่าสุดได้แล้วที่ Google Play ครับ

ที่มา - ทวิตเตอร์ @OfficeNews, MSPoweruser

Read more   4 comments  
By mk Founder on Tag: Google Translate, Translation, OCR, Japan
Google Translate

Word Lens ฟีเจอร์ใช้กล้องถ่ายภาพเพื่อแปลภาษาของ Google Translate รองรับการแปลข้อความภาษาญี่ปุ่นเป็นภาษาอังกฤษแล้ว ช่วยให้คนที่เดินทางไปเที่ยวประเทศญี่ปุ่น สามารถยกมือถือขึ้นมาแปลป้ายได้อย่างง่ายๆ

ฟีเจอร์นี้สามารถทำงานแบบออฟไลน์ได้ด้วย โดยเราต้องดาวน์โหลดฐานข้อมูลคำแปลมาเก็บไว้ในเครื่องในการใช้งานครั้งแรกก่อน

ตอนนี้ฟีเจอร์นี้ใช้งานได้แล้ว เพียงแค่อัพเดตแอพ Google Translate เป็นเวอร์ชันล่าสุด เลือกให้แปล Japanese เป็น English แล้วกดปุ่มกล้องในตัวแอพได้เลย

Read more   5 comments  
By mk Founder on Tag: Android, OCR, Mobile App, Microsoft, Microsoft Office
Android

แอพถ่ายภาพแล้วแปลงเป็นเอกสาร มีให้ดาวน์โหลดบน Windows Phone มาได้สักพักใหญ่ๆ ตามด้วยเวอร์ชัน iOS เมื่อไม่นานมานี้ ฝั่งของ Android หลังจากทดสอบแบบพรีวิวมานานเกือบสองเดือน ก็เปิดให้คนทั่วไปดาวน์โหลดแล้ว

Read more   11 comments  
By nuntawat Writer on Tag: OCR, Mobile App, iPad, OneNote, Microsoft
OCR

ไมโครซอฟท์ได้อัพเดตแอพ OneNote for iPad ให้รองรับการจดบันทึกหรือวาดรูปโดยใช้นิ้วหรือสไตลัสแล้ว โดยมีทั้งปากกา ปากกาเมจิก (marker) และปากกาเน้นข้อความ (highlighter) ให้เลือกใช้ แอพ OneNote รุ่นใหม่นี้ยังมีระบบตรวจจับฝ่ามือขณะใช้สไตลัสวาดเขียน ทำให้ผู้ใช้สามารถวางฝ่ามือในท่าทางต่างๆ (ดูภาพท้ายข่าวประกอบ) ขณะวาดเขียนได้โดยสะดวก

Read more   6 comments  
OCR

ไมโครซอฟท์มีแอพชื่อ Office Lens บน Windows Phone ใช้สำหรับถ่ายภาพเอกสารแล้วแปลงเป็นโน้ตของ OneNote (ข่าวเก่า) ล่าสุดไมโครซอฟท์อัพเกรดความสามารถของมันเพิ่มเติม ให้สามารถถ่ายภาพเอกสารแล้วแปลงเป็นไฟล์ Word หรือ PowerPoint ได้ด้วย

หลักการทำงานของมันคือใช้เทคนิค image processing ช่วยแปลงเอกสารที่อาจถ่ายมุมเอียง กลับมาเป็นเอกสารที่ถูกสแกนมาแบบแนวราบ จากนั้นใช้เทคนิค OCR แปลงข้อความบนเอกสารเป็นไฟล์ข้อความ โดยยังคงรักษาฟอร์แมตของเอกสารเอาไว้ (ทำได้แม้กระทั่งตาราง) แนะนำให้ดูภาพและวิดีโอประกอบ

Read more   32 comments  
By ipats Contributor on Tag: Browser, Chrome, OCR, Extension
Browser

เคยไหม? เจอปัญหาเล่นอินเทอร์เน็ตอยู่แล้วเจอภาพที่มีข้อความน่าสนใจอยากก็อปปี้ไปค้นข้อมูลต่อ ถ้าสั้นๆ ไม่กี่คำ เราก็อาจจะพิมพ์ใหม่ได้ไม่เสียเวลามากแต่ถ้ายาวเป็นประโยคก็อาจจะเหนื่อยหน่อย หรือเจอข้อความภาษาที่ไม่คุ้นอยู่ในภาพจะเอาไปแปลก็ไม่รู้จะพิมพ์อย่างไร

Read more   7 comments  
By nuntawat Writer on Tag: OCR, Bing, SkyDrive, Windows 8.1, Microsoft
OCR

หลังจากไมโครซอฟท์เพิ่มฟีเจอร์แปลงภาพเป็นข้อความ (OCR) บน SkyDrive โดยใช้เทคโนโลยีจาก Bing เมื่อเดือนก่อน ล่าสุดบริษัทประกาศว่ากำลังปล่อยฟีเจอร์ใหม่บน Smart Search (หรือบางคนเรียก Universal Search) ที่เพิ่มเข้ามาใน Windows 8.1 ให้ผู้ใช้สามารถค้นหาข้อความบนรูปภาพที่เก็บอยู่ในโฟลเดอร์ Camera Roll บน SkyDrive ได้ เมื่อพบข้อความนั้นก็จะแสดงผลภาพที่มีข้อความดังกล่าว

ที่มา: Inside SkyDrive

Read more   1 comment  
By mk Founder on Tag: OCR, Bing, SkyDrive, Microsoft
OCR

ไมโครซอฟท์ยังเดินหน้าเพิ่มฟีเจอร์ให้ SkyDrive อย่างต่อเนื่อง ล่าสุดประกาศว่ารูปภาพที่เราเก็บใน SkyDrive สามารถถูกแปลงมาเป็นข้อความโดยเทคโนโลยี optical character recognition (OCR)

เทคโนโลยีนี้มาจากทีม Bing และจะถูกเรียกใช้เฉพาะ SkyDrive.com เวอร์ชันเว็บเท่านั้น (ตั้งให้ซิงก์ภาพจากมือถือเก็บลง SkyDrive แล้วไปเปิดดูในเว็บได้) ตอนนี้ยังรองรับเฉพาะภาษาอังกฤษ สเปน โปรตุเกส ฝรั่งเศส และเยอรมนีครับ

Read more   6 comments  
Google

ไม่กี่เดือนก่อนหน้านี้ Google Translate สำหรับ Android ได้ปรับปรุงการแปลภาษาพร้อมระบบ OCR ซึ่งรองรับหลายภาษาในยุโรป จนล่าสุดภาษาจีน, ญี่ปุ่น และเกาหลี ก็ถูกเพิ่มเข้าในระบบนี้ด้วยเช่นกัน ซึ่งเมื่อรวมกับภาษาที่รองรับอยู่แต่เดิม ทำให้ตอนนี้ Google Translate สำหรับ Android สามารถใช้งานแปลได้รวม 65 ภาษาแล้ว (ภาษาไทยก็รวมอยู่ในนี้ด้วย)

อย่างไรก็ตาม การแปลข้อความใน 3 ภาษาข้างต้นยังคงรองรับเฉพาะข้อความในแนวนอนเท่านั้่น ยังไม่มีข้อมูลว่าจะมีการพัฒนาระบบให้รองรับข้อความในแนวตั้งในภายหลังหรือไม่

Read more   3 comments  
Subscribe to OCR
Apple
public://topics-images/apple_webp.png
SCB10X
public://topics-images/347823389_774095087711602_515970870797767330_n_webp.png
Windows 11
public://topics-images/hero-bloom-logo.jpg
Doom
public://topics-images/doom_logo.png
Huawei
public://topics-images/huawei_standard_logo.svg_.png
Threads
public://topics-images/threads-app-logo.svg_.png
Google Keep
public://topics-images/google_keep_2020_logo.svg_.png
Fortnite
public://topics-images/fortnitelogo.svg_.png
Instagram
public://topics-images/instagram_logo_2022.svg_.png
SCB
public://topics-images/9crhwyxv_400x400.jpg
Microsoft
public://topics-images/microsoft_logo.svg_.png
Basecamp
public://topics-images/bwpepdi0_400x400.jpg
Tinder
public://topics-images/hwizi8ny_400x400.jpg
FTC
public://topics-images/seal_of_the_united_states_federal_trade_commission.svg_.png
Pinterest
public://topics-images/pinterest.png
Palantir
public://topics-images/-nzsuc6w_400x400.png
Gemini
public://topics-images/google_gemini_logo.svg__0.png
AIS Business
public://topics-images/logo-business-2021-1.png
PostgreSQL
public://topics-images/images.png
JetBrains
public://topics-images/icx8y2ta_400x400.png
Krungthai
public://topics-images/aam1jxs6_400x400.jpg
Palworld
public://topics-images/mccyhcqf_400x400.jpg
Bill Gates
public://topics-images/bill_gates-september_2024.jpg
VMware
public://topics-images/1nj4i1gp_400x400.jpg
Take-Two Interactive
public://topics-images/0khle7nh_400x400.jpg
OpenAI
public://topics-images/ztsar0jw_400x400.jpg
Thailand
public://topics-images/flag_of_thailand.svg_.png
NVIDIA
public://topics-images/srvczsfq_400x400.jpg
ServiceNow
public://topics-images/ytnrfphe_400x400.png
PS5
public://topics-images/playstation_5_logo_and_wordmark.svg_.png
Klarna
public://topics-images/urcllpjp_400x400.png
Google Play
public://topics-images/play.png
Drupal
public://topics-images/drupal.png
Virtua Fighter
public://topics-images/virtua_figther_2024_logo.png
Paradox Interactive
public://topics-images/paradox_interactive_logo.svg_.png
Europa Universalis
public://topics-images/europa-icon.png
Nintendo Switch 2
public://topics-images/mainvisual.png
Cloudflare
public://topics-images/cloudflare_logo.svg_.png
Samsung
public://topics-images/samsung.png
Google
public://topics-images/google_2015_logo.svg_.png
Uber
public://topics-images/uber.png
Microsoft 365
public://topics-images/m365.png