目录
- 1.Nuget搜索Tesseract
- 2.项目安装Tesseract
- 3.引用命名空间
- 4.上Github下载别人的训练库
- 5.选择图片进行识别
1.Nuget搜索Tesseract
2.项目安装Tesseract
3.引用命名空间
using Tesseract;
4.上Github下载别人的训练库
https://github.com/tesseract-ocr/tessdata 这里下载中文的chi_sim.traineddata,放到了D盘根目录
5.选择图片进行识别
我把图片命名为image.jpg放在了D盘根目录
//图片文件路径 string imageFileName = @"D:\image.png"; //创建位图对象 Bitmap image = new Bitmap(imageFileName); //Tesseract.Page Page page = new TesseractEngine(@"D:\", "chi_sim", EngineMode.Default).Process(PixConverter.ToPix(image)); //释放程序对图片的占用 image.Dispose(); //打印识别率 Console.WriteLine(String.Format("{0:P}", page.GetMeanConfidence())); //打印识别文本 //替换'/n'为'(空)'//替换'(空格)'为'(空)' Console.WriteLine(page.GetText().Replace("\n", "").Replace(" ", ""));
识别率为百分之84,识别文字为立白liby
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论(0)