
近日,百度文心致密发布新一代OCR模子PP-OCRv6,一次性推出Tiny、Small、Medium三档模子,搭救50多种说话,遮掩浏览器端、镶嵌式建造到做事器等主流场景。公开效果披露,PP-OCRv6再次刷新OCR范围评测记载,详细性能位居人人第一。
其中,PP-OCRv6Tiny的尺寸仅1.5MB,可平直部署于腹地浏览器环境,单图瞻望最快仅需97毫秒。用户数据无需上传云霄即可完成OCR处理,在保险心事安全的同期,大幅缩短部署门槛。有开荒者评价,PP-OCRv6可能是人人惟一可在浏览器环境运转的高精度OCR模子,为Agent装上一对眼睛,梗概在智能办公、素质、工业等场景提供愈加轻量、高效的视觉感知才略。
在性能方面,PP-OCRv6在保握轻量化上风的同期进一步擢升识别精度和推理速率,详细性能显赫增强。PP-OCRv6在文本检测和文本识别任务等诀别获取86.2和83.2的收货,双双刷新此前由PP-OCRv5保握的OCR范围最好水平,开云体育(中国)官方网站举座推崇最初于Qwen3-VL-235B、GPT-5.5、Gemini-3.1-Pro等国表里主流多模态大模子,在OCR专科任务上展现出更强竞争力。

行动文心大模子多模态才略的垂危构成部分,PP-OCR系列连年来握续鞭策文本检测与识别本事升级,先后推出PP-OCRv1至PP-OCRv6等多个版块。当今kaiyun开云体育2026世界杯中国官网,PP-OCR系列处所的PaddleOCR名目已搭救超110种说话识别,做事遮掩人人170多个国度和地区。
滚球app2026世界杯中国官网下载凭借轻量化、高精度等脾性,PP-OCR系列已被无为集成至UmiOCR、MinerU、TurboOCR等业界OCR用具链中,并哄骗于文档领略、数据处理、常识库构建等场景,成为开荒者和企业常用的开源OCR措置决议之一;同期,PP-OCR系列也成为各大模子团队开展数据预处理、文档领略和常识索取的垂危用具,为模子教练与哄骗落地提供搭救。在GitHub上,PaddleOCR的Star数目已冲破8.22万,跨越谷歌旗下开源OCR标杆产物TesseractOCR,成为人人最受调遣的开源OCR名目之一。
当今,PP-OCRv6已上线PaddleOCR官网,用户可通过网页或API格局快速使用,代码和模子权重也已开源至Github和HuggingFace,做事弘大用户下载和使用。