Image
By lew Founder on Tag: LLM, Claude, DeepSeek, Xiaomi
LLM

OpenRouter อัพเดตการใช้งาน LLM ผ่านแพลตฟอร์มในหมวดการเขียนโปรแกรม โดยความพิเศษในรอบนี้คือ Claude หลุดจากกลุ่ม 5 อันดับแรกที่ใช้เขียนโปรแกรมเป็นครั้งแรก แต่ยังมี Claude Opus 4.7 อยู่อันดับที่ 8 ที่ปริมาณการใช้งาน 4% รวม 129B โทเค็น

5 อันดับแรกของการใช้งานในหมวดการเขียนโปรแกรมสัปดาห์ล่าสุด ได้แก่ 1) MiMo-V2.5 2) MiMo-V2.5-Pro 3) DeepSeek V4 Flash 4) DeepSeek V4 Pro 5) MiniMax M3

By lew Founder on Tag: Claude, LLM
Claude

เว็บ Axios อ้างแหล่งข่าวไม่เปิดเผยตัวตนแต่ระบุว่าเป็นที่ปรึกษาปัญญาประดิษฐ์ ระบุว่าลูกค้ารายหนึ่งไม่ได้จำกัดจำนวนโทเค็นของพนักงาน ทำให้ภายในเดือนเดียวต้องจ่ายค่าโทเค็นไป 500 ล้านดอลลาร์

บัญชี Claude แบบองค์กรเปิดให้องค์กรสามารถจ่ายค่าโทเค็นเพิ่มได้หากโควต้าตามบัญชีหมด หากไม่ได้จำกัดการใช้งานไว้ก็จะเปิดทางให้พนักงานใช้โทเค็นไปเรื่อยๆ

By lew Founder on Tag: Anthropic, LLM, Claude
Anthropic

Anthropic เปิดตัว Claude Opus 4.8 ที่อัปเกรดจาก Opus 4.7 ในทุกด้าน โดยเฉพาะด้านการเขียนโปรแกรมและการทำงานแบบเอเจนติก แต่จุดสำคัญที่สุดคือเพิ่มความซื่อสัตย์ในการตอบ

ความซื่อสัตย์ของ Opus 4.8 ทำให้มันไม่ยอมตอบคำถามที่มันตอบไม่ได้ และวิเคราะห์ความคืบหน้าของงานว่าทำงานคืบหน้าไปเพียงใด

ผลการวัด misaligned behavior หรือพฤติกรรมไม่พึงประสงค์พบว่า Opus 4.8 มีอัตราลดลงอยู่ในระดับเดียวกับ Claude Mythos

By mk Founder on Tag: Claude, Anthropic, Security
Claude

Anthropic เผยความคืบหน้าของ Project Glasswing การนำโมเดล Claude Mythos ไปช่วยหาช่องโหว่ของซอฟต์แวร์โอเพนซอร์สต่างๆ จำนวนมากกว่า 1,000 โครงการ พบว่าค้นพบ "ว่าที่" ช่องโหว่ความปลอดภัย 23,019 ตัว ในจำนวนนี้มีประมาณ 6,202 ตัวที่ Mythos ประเมินความรุนแรงระดับ high หรือ critical

Anthropic ร่วมมือกับบริษัทความปลอดภัย 6 แห่ง กระจายกันตรวจสอบยืนยันว่าที่ช่องโหว่ 1,752 ตัว พบว่า 90.6% เป็นช่องโหว่จริงๆ และ 62.4% มีความรุนแรงระดับ high หรือ critical จริง (แปลว่าส่วนที่เหลือเป็นช่องโหว่จริง แต่ความรุนแรงอาจน้อยกว่าที่ Mythos ประเมิน)

By lew Founder on Tag: Claude, Security, Cloudflare
Claude

Cloudflare รายงานถึงผลการทดสอบ Claude Mythos โมเดลปัญญาประดิษฐ์รุ่นสูงสุดของ Anthropic ที่เป็นข่าวจากการเปิดตัวด้วยการพบช่องโหว่ซอฟต์แวร์จำนวนมาก โดยพบว่าการทำงานเหนือกว่าโมเดลปัญญาประดิษฐ์อื่นๆ เพราะมีความสามารถวิเคราะห์ช่องโหว่ระดับต่ำๆ จำนวนมากว่าหากนำมาร้อยเข้าด้วยกันแล้วจะกลายเป็นการโจมตีระดับสูงได้ พร้อมความสามารถในการเขียนโปรแกรมทดสอบได้ในตัวว่าช่องโหว่ใช้เจาะได้จริงหรือไม่

By arjin Writer on Tag: Claude, Anthropic, Artificial Intelligence, OpenClaw
Claude

Anthropic ประกาศว่าผู้ใช้งาน Claude แบบเสียเงินทุกประเภท จะได้โควต้าใช้งานรูปแบบใหม่เพิ่มเติมสำหรับการทำงานแบบเขียนโปรแกรมสั่งการ (Programmatic Usage) เช่น Claude Agent SDK, claude -p, Claude Code GitHub Actions ไปจนถึงการใช้งานเครื่องมือ 3rd Party เช่น OpenClaw โดยไม่ต้องจ่ายเงินเพิ่ม แต่เป็นกระบวนการคิดการใช้งานที่แยกส่วนกัน

โควต้าใช้งานแบบใหม่ซึ่งเรียกว่า Agent SDK Usage นี้ มีปริมาณตามมูลค่าของแผนที่ใช้งานต่อเดือน และคำนวณแยกจากการใช้งานพื้นฐานแบบพิมพ์โต้ตอบที่เรียกว่า Interactive Usage (Chat, Claude Code, Claude Cowork) หากการใช้งานเต็มโควต้าส่วน Agent SDK Usage แล้ว จะเริ่มนับโควต้าเพิ่มเติมส่วน API ต่อ หากมีการเปิดใช้งาน แต่หากไม่ได้เปิดใช้งานจะต้องรอครบกำหนดหนึ่งเดือนจึงจะได้โควต้าคืน โควต้าที่ใช้ไม่หมดแต่ละเดือนจะไม่นำไปทบรวมในเดือนถัดไป การเปลี่ยนแปลงนี้จะเริ่มมีผลตั้งแต่ 15 มิถุนายน เป็นต้นไป โดย Anthropic จะส่งอีเมลแจ้งรายละเอียดเพิ่มเติม

By lew Founder on Tag: Curl, Claude, Security
Curl

หลัง Anthropic เปิดตัว Claude Mythos โมเดลปัญญาประดิษฐ์ขนาดใหญ่ (และสุดแพง) โดยโชว์ความสามารถในการหาช่องโหว่ซอฟต์แวร์ วันนี้ Daniel Stenberg ผู้สร้าง curl ก็ออกมาเล่าประสบการณ์ที่ได้ร่วมโครงการทดสอบ Mythos

By mk Founder on Tag: Microsoft Copilot, Microsoft, Claude
Microsoft Copilot

เมื่อเดือนมีนาคม ไมโครซอฟท์เปิดตัว Copilot Cowork ซึ่งเป็นการนำฟีเจอร์ของ Claude Cowork เข้ามาฝังใน Microsoft 365 โดยตรง ไม่ต้องไปรัน Claude Cowork แยกเองข้างนอก

เวลาผ่านมาสองเดือน ไมโครซอฟท์ขยายความสามารถของ Copilot Cowork อีก 3 อย่าง โดยเป็นการขยายตามแนวทางของ Claude Cowork ที่มีอยู่ก่อน ได้แก่

By arjin Writer on Tag: Anthropic, Claude, SpaceX, xAI, Data Center, Artificial Intelligence
Anthropic

Anthropic และ SpaceX ประกาศทำข้อตกลงในการใช้งานศูนย์ข้อมูล Colossus 1 ของ SpaceX โดย Anthropic จะได้ใช้งานทรัพยากรทั้งหมดในศูนย์ข้อมูลนี้ กำลังประมวลผลรวมมากกว่า 300 เมกะวัตต์ คิดเป็นจีพียู NVIDIA มากกว่า 220,000 ตัว ซึ่งมีทั้ง H100, H200 และ GB200 มีผลภายในเดือนนี้

By arjin Writer on Tag: Claude, Anthropic, LLM, Artificial Intelligence, Adobe, Affinity, Blender
Claude

Anthropic ประกาศความร่วมมือกับผู้พัฒนาแอปสำหรับงานสร้างสรรค์หลายราย เพื่อให้ Claude สามารถเชื่อมต่อผ่าน Connectors ในการทำงานร่วมกับแอปเหล่านี้ได้ไม่ว่าจะเป็นโครงการขนาดเล็กหรือโครงการขนาดใหญ่ที่ซับซ้อน

รายชื่อแอปที่ประกาศรอบนี้ได้แก่ Ableton, Adobe, Affinity, Autodesk Fusion, Blender, Resolume Arena กับ Resolume Wire, SketchUp และ Splice

สำหรับความร่วมมือกับ Blender นั้นมีความพิเศษเพราะ Anthropic ได้ร่วมสนับสนุนในโครงการโอเพนซอร์สของ Blender ด้วย และร่วมพัฒนา API Python เพื่อให้รองรับการเชื่อมต่อผ่าน MCP และเข้าถึงโมเดลผ่านวิธีการอื่น ๆ ไม่จำกัดเฉพาะการใช้ Claude

By arjin Writer on Tag: Anthropic, Claude, Social Commerce, Artificial Intelligence
Anthropic

Anthropic รายงานผลการทดลองภายในบริษัทเพื่อดูว่า AI Agent เก่งพอที่จะดำเนินการเจรจาซื้อขายแลกเปลี่ยนสินค้าแทนคนได้ดีแค่ไหน ซึ่งเป็นขั้นกว่าของ Project Vend ที่โมเดล Claude บริหารตู้ขายสินค้าให้คน โดย Anthropic เรียกการทดลองนี้ว่า Project Deal

By arjin Writer on Tag: Firefox, Mozilla, Security, Claude
Firefox

Mozilla เปิดเผยว่าหลังความร่วมมือกับ Anthropic ในการใช้งาน Claude Mythos เพื่อสแกนหาช่องโหว่ของ Firefox ทำให้อัปเดตล่าสุด Firefox 150 มีการแก้ไขช่องโหว่ความปลอดภัยมากถึง 271 รายการ ซึ่งทั้งหมดถูกตรวจสอบยืนยันแล้ว

Mozilla บอกว่าความสามารถของ Mythos ทำให้ทีมต้องปรับวิธีการทำงาน เพราะเหมือนมีการรายงานช่องโหว่ความปลอดภัยระดับร้ายแรงจำนวนมากพร้อมกัน ที่ผ่านมาแนวทางของ Firefox คือการออกแบบการทำงานเชิงลึก เพื่อทำให้การโจมตีช่องโหว่ทำได้ยากและไม่คุ้มที่จะทำ ซึ่งกระบวนการนี้เมื่อต้องการหาช่องโหว่จริง ๆ ด้วยคนจะซับซ้อนมาก ซึ่ง Mythos มีความสามารถค้นเจอช่องโหว่เหล่านี้

By arjin Writer on Tag: Claude, Anthropic, Design, Artificial Intelligence
Claude

Anthropic เปิดตัว Claude Design ผลิตภัณฑ์ใหม่จากทีม Anthropic Labs สำหรับใช้ในงานออกแบบ, ทำต้นแบบ, ทำสไลด์, เอกสารแบบ 1-page เป็นต้น (หรือถ้าอธิบายตามตลาดหุ้นสหรัฐเมื่อคืนนี่ก็คือ Figma)

Claude Design ทำงานด้วยโมเดล Claude Opus 4.7 ตัวล่าสุดในโหมด vision จุดเด่นที่ Anthropic ยกมามีหลายอย่าง เช่น สร้างต้นแบบที่สมจริงโต้ตอบได้ โดยไม่ต้องพึ่งการเขียนโค้ด, prompt ให้สร้างแนวทางหลายแบบประกอบการตัดสินใจ, รองรับการสร้างงานแบบใหม่ ๆ เช่น 3D หรือวิดีโอ

By lew Founder on Tag: Claude, Anthropic, LLM
Claude

Anthropic เปิดตัว Claude Opus 4.7 ที่ผลทดสอบจำนวนมากฉีกออกจาก Opus เวอร์ชั่นก่อนหน้านี้หลายตัว ทำคะแนนได้กึ่งกลางระหว่าง Opus 4.6 และ Mythos ที่ยังไม่เปิดให้บริการกับคนทั่วไป

คะแนนทดสอบดีขึ้นหลายจุด แต่ Anthropic ยกจุดสำคัญในอัพเดตครั้งนี้ ได้แก่

By lew Founder on Tag: Security, Claude
Security

Bruce Schneier ผู้เชี่ยวชาญความปลอดภัยไซเบอร์วิเคราะห์ข่าวการเปิดตัว Claude Mythos ที่สามารถหาช่องโหว่ซอฟต์แวร์ได้นับพันรายการ ว่าเป็นการวางแผนประชาสัมพันธ์ของ Anthropic ที่ประสบความสำเร็จอย่างมาก เพราะสื่อลงข่าวเป็นวงกว้างดึงความสนใจจากคู่แข่งอย่าง OpenAI ไปได้มาก และเอาเข้าจริงแล้วโมเดลอื่นๆ ที่เล็กกว่าและถูกกว่า Mythos ก็หาช่องโหว่บางตัวได้เหมือนกัน

By arjin Writer on Tag: Claude, Artificial Intelligence, Retail, Andon Labs
Claude

ปีที่แล้วมีสตาร์ทอัปชื่อ Andon Labs ได้ทดลองโครงการตู้ขายสินค้าอัตโนมัติ (Vending Machine) พลัง AI Claude โดยติดตั้งที่สำนักงานของ Anthropic ซึ่งตู้ขายสินค้านี้จะตัดสินใจเองทุกอย่างตั้งแต่การสั่งของมาขาย การตั้งราคาสินค้า ไปจนถึงการต่อรองราคากับลูกค้า โดยอ้างอิงจากข้อมูลพื้นฐานที่กำหนดไว้เบื้องต้น ผลลัพธ์คือโครงการนี้ ขาดทุน เงินหมด ล้มละลาย แต่ก็ไม่ใช่เรื่องเกินคาดเพราะ Andon Labs มีเป้าหมายทดลองขีดความสามารถของ AI เพื่อใช้เป็นกรณีศึกษา

เมื่อสัปดาห์ที่ผ่านมา Andon Labs เปิดตัวโครงการใหม่เล่นใหญ่กว่าเดิม คราวนี้มาเป็นร้านค้าปลีกแบบมีหน้าร้านเต็มรูปแบบชื่อว่า Andon Market ตั้งอยู่ในย่าน Cow Hollow ที่ซานฟรานซิสโก สหรัฐอเมริกา ด้วยโจทย์ว่าถ้า AI เป็นเจ้าของร้าน ดูแลทุกอย่างเองทั้งหมด จะรอดหรือไม่?

By arjin Writer on Tag: Claude, Anthropic, Microsoft Word, LLM
Claude

Anthropic ส่วนเสริมสำหรับ Microsoft Word "Claude for Word" เพิ่มเติมจากส่วนเสริมของ Excel และ PowerPoint ที่ออกมาก่อนหน้านี้

Claude for Word มีความสามารถในการร่างเอกสาร แก้ไขเอกสาร และตรวจทวนเนื้อหาในเอกสาร ซึ่งสั่งงานได้ทันทีจากแถบด้านข้างของ Word โดยยังรักษาฟอร์แมตการจัดวางของเอกสารไว้ รวมทั้งเปิดการทำงาน tracked changes ให้ผู้ใช้งานตรวจสอบรายละเอียดการแก้ไขได้ในแต่ละขั้นตอน

Claude for Word เปิดให้ใช้งานแล้วสำหรับลูกค้า Team และ Enterprise สถานะของเครื่องมือยังเป็นเบต้า

ที่มา: Anthropic

By lew Founder on Tag: Claude, Anthropic, LLM, Security
Claude

Anthropic เปิดตัวโมเดลรุ่นใหญ่สุดในชื่อ Claude Mythos เป็นโมเดลรุ่นใหญ่ความสามารถสูง ผลทดสอบต่างๆ ทำคะแนนเหนือกว่าโมเดลเดิมๆ อย่างชัดเจน เช่น SWE Bench Verified ที่ทำคะแนนได้ถึง 93.9% แซงหน้า Claude Opus ขึ้นถึง 13.1% หรือคะแนนทดสอบอื่นๆ เช่น SWE Bench Pro, Terminal Bench 2.0 ก็ล้วนทำคะแนนทิ้งห่างจาก Claude Opus 4.6

By lew Founder on Tag: Claude, Programming, LLM
Claude

ผู้ใช้ GitHub บัญชี stellaraccident เขียนรายงานวิเคราะห์ว่าในช่วงเดือนที่ผ่านมา Claude Code ความสามารถลดลงมาก โดยเขาอาศัย log ทั้งหมดในช่วงหลายเดือนที่ผ่านมาวิเคราะห์พฤติกรรมของ Claude Code

รายงานพบว่า Claude เริ่มปิดบัง thinking token มากขึ้นเรื่อยๆ จนปิดบังทั้งหมด ขณะที่อัตราการคิดก่อนตอบโดยเฉลี่ยก็สั้นลงเรื่อยๆ ส่งผลต่อคุณภาพการเขียนโค้ดโดยรวมลดลง เช่น ก่อนหน้านี้ Claude Code จะพยายามอ่านไฟล์ก่อนแก้ไขเสมอ แต่ช่วงหลังกลับพยายามแก้ไขทันที ส่งผลให้การแก้ไขไฟล์ล้มเหลวมากขึ้น หลายครั้งก็คิดวนไปวนมาเปลืองโทเค็นไปเปล่าๆ

Anthropic

Anthropic ประกาศขยายข้อตกลงการใช้งาน TPU รองรับการประมวลผล AI บน Google Cloud โดยบอกว่าเป็นกำลังประมวลผลรวมระดับหลายกิกะวัตต์ และเป็น TPU รุ่นใหม่ที่คาดว่าจะใช้งานได้ในปี 2027 รองรับการพัฒนาโมเดล Claude รุ่นใหม่ ตลอดจนรองรับการใช้งานจากลูกค้าทั่วโลก

อย่างไรก็ตามในข้อตกลงนี้มี Broadcom เป็นผู้ผลิต TPU ให้กับ Google Cloud ซึ่งฝั่ง Broadcom ก็บอกว่ากำลังประมวลผลส่วนบริษัทผลิตชิปให้นั้นอยู่ที่ประมาณ 3.5 กิกะวัตต์

Subscribe to Claude