九游娱乐(中国)官方网站-登录入口

ag九游会官方OCR更成为大模子厂商布局的重心标的-九游娱乐(中国)官方网站-登录入口

发布日期:2026-04-04 08:07    点击次数:102

ag九游会官方OCR更成为大模子厂商布局的重心标的-九游娱乐(中国)官方网站-登录入口

快科技3月31日音书,近日,百度文心生息模子PaddleOCR在GitHub上的Star数冲破73.3K,初度高出谷歌旗下开源OCR标杆家具Tesseract OCR(73.2K),成为众人Star数最高的OCR技俩。

Tesseract OCR降生于1985年,起初由惠普现实室研发,2005年开源后由Google接办珍重并抓续迭代,是OCR限制不息近四十年的本领标杆,恒久位居GitHub OCR技俩Star数榜首。

这次被PaddleOCR高出,鲜艳着这一标杆正在被新一代本领体系改写,亦然大模子起初下中国开源技俩初度在OCR限制高出谷歌主导的标杆家具。

百度打败谷歌!PaddleOCR成GitHub最受迎接OCR技俩:中国开源首度登顶

PaddleOCR基于文心大模子磨练而来,是文心大模子多模态智力的热切部分,扶助超100种话语识别,用户笼罩160个国度和地区。1月29日,新一代文档透露模子PaddleOCR-VL-1.5在 OmniDocBench V1.5 榜单中取得了众人SOTA收获。

频年来,大模子成为OCR赛说念增长的热切能源。Star History数据显现,PaddleOCR在GitHub上的Star自2024年起呈现爆发式增长。2025年以来,OCR更成为大模子厂商布局的重心标的,DeepseekOCR、HunyuanOCR、GLM OCR等家具接踵发布。

此外,PaddleOCR同步升级处事智力:官网免费逐日透露页数由1万提高至2万,用户还可通过OpenClaw径直调用PaddleOCR Skill,免费获得高精度PDF透露智力。

与此同期,PaddleOCR OCEAN生态定约负责竖立,面向中枢开源孝顺者、深度企业用户及众人平台伙伴绽放,首批成员包括Hugging Face、Dify、RAGFlow、Cherry Studio、Milvus等众人平台伙伴,将共同鞭策OCR本领在更粗俗场景中的利用落地。

ps.OCR(Optical Character Recognition,光学字符识别)是指通过光学开拓(如扫描仪、录像头)获得图像中的文本信息,再通过测度打算机算法将其转机为可剪辑、可检索、可分析的数字文本的本领。简便来说,即是让测度打算机看见并读懂图像中的笔墨,杀青 "图像文本→数字文本" 的精确转机。

百度打败谷歌!PaddleOCR成GitHub最受迎接OCR技俩:中国开源首度登顶

【本文为止】如需转载请务必注明出处:快科技

职守剪辑:朝日ag九游会官方