tesseract取词 2019-4-30 17:15 | 346| 0| 技术创作 226 字| 5 分钟 tesseract是google开源能够使用ocr技术从图片、PDF文件摘取的内容的库,准确率相对较高。 1.下载安装 GitHub链接 安装参考链接 Ubuntu18环境 apt install tesseract-ocr apt install tesseract-ocr-chi-sim 可以查询语言包,有很多种 apt search tess… ocrtesseract取词