识别中英文 - 爱.NET - ITeye博客

`

lovnet

浏览: 6710613 次
性别:
来自: 武汉

最近访客更多访客>>

u012363178

jx_colin

MauerSu

wangyy

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

全部博客 (7414)

社区版块

存档分类

2013-03 ( 20)
2013-02 ( 53)
2013-01 ( 90)
更多存档...

最新评论

逐客叫我：看完了懵了，一会原生方法栈一会堆，自己都不用一套。
深入JVM系列（一）之内存模型与内存分配
xhwahaha： import java.util.Arrays;public ...
腾讯的一个面试题
j00131120：总结的非常不错
从员工到总监，你要明白的8个道理
Will.Du：这是thinking in java的例子吧
对象序列化
ping22changxin：能否借你事例源码学习一下，谢谢了：812185421@qq.c ...
ActiveMQ发送ObjectMessage的一个问题

识别中英文

阅读更多

本文作者：林子木

问：C语言的char的数组中有中文和英文怎么取出来

文本是从文本文件读取出来的，放进去，怎么取出来不出现乱码？中文是两个字节，英文是一个字节，如果取到英文再去取中文，中文就会乱码。怎么解决这个问题？

问题补充：

一次全部打印没问题,但是我现在的问题是需要把它截断显示，功能是电子书的分页，所以分页的时候如果把中文当成英文取的话后面就全乱了，请问各位到底应该怎么解决，全部门没一个人会

林子木的回答：

// test_read_chinese.cpp : 定义控制台应用程序的入口点。
//

#include "stdafx.h"
#include<stdio.h>
#include <conio.h>
#include <stdlib.h>
int _tmain(int argc, _TCHAR* argv[])
{
FILE *fp;
char ch;
if((fp=fopen("c:\\stu.txt","rt+"))==NULL)
{
printf("\nCannot open file strike any key exit!");
getch();
exit(1);
}
ch=fgetc(fp);
while(ch!=EOF)
{
putchar(ch);
ch=fgetc(fp);
}
fclose(fp);
while(1);
return 0;
}

告诉你我调试的结果：
英文字符：其实无所谓什么读取字符之类的，其实就是8bit的数据罢了，英文字符或者符号，其实仔细看的话，ASCII码表加续表最多到了7F,注意了是7F哦。这样你在文本里面打任何字符或者符号，挺正常的不多说。
中文字符：一旦遇到了中文字符，是16bit，分两次读取，你会发现这个时候8bit的最高位为1了，这里就是关键，就是说为了防止中英文编码的错乱，为了防止误读，中英文编码不在同一个码段。

综上所诉，就是说只要碰到读取的值大于7F 那么就是两个字节的中文字符！

分享到：

献给在大学里面想做点东西的信息人 | 如何学习单片机

2011-08-09 13:42
浏览 781
评论(0)
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Android 文字识别，支持识别中英文，附源码及apk文件: Android 文字识别，支持识别中英文，附源码及apk文件

OCR实时扫描识别中英文: 本项目利用tesseract实现了扫描识别中英文，避开了传统的拍照然后上传图片在去识别的过程。由于上传文件的60M大小限制，这里剔除掉了build文件，使用时Android studio重新编译一下就OK了

表格识别ocr模型，基于paddleocr训练，可以识别中英文表格数据: 表格识别ocr模型，基于paddleocr训练，可以识别中英文表格数据

安卓OCR图像识别相关-本项目利用tesseract实现了扫描识别中英文避开了传统的拍照然后上传图片在去识别的过程。由于上传文件的60M大小限制这里剔除掉了build文件使用时Androidstudio重新编译一下就OK了.rar: 本项目利用tesseract实现了扫描识别中英文，避开了传统的拍照然后上传图片在去识别的过程。由于上传文件的60M大小限制，这里剔除掉了build文件，使用时Android studio重新编译一下就OK了.rar,太多无法一一验证是否...

车牌识别程序提取车牌并可以识别中文英文字母和数字: 这样在图片中出现较多的蓝色背景情况下识别率会下降，不能有效提取车牌区域。对此本文提出了自适应调节方案。对分割出来的区域进行识别调整。根据长宽比，蓝白色比对候选区域进行多次定位。最终找到车牌区域。

java 判断中英文: java 判断中英文

tesseract OCR 字符识别，中英文都有库，C#封装，有例子: OCR,tesseract41，用C#封装接口生成调用库，方便C#使用,有使用例子。

场景文字识别中英文字符图片: 本图片为手动切割ICDAR2013比赛识别部分的数据集，一共分割出了2千多张单字符，希望能给大家提供帮助

基于机器的智能人脸识别英文版_12713572: Machine, based Intelligent Face Recognition discusses the general engineering method of imitating intelligent human brains for video-based face recognition in a fundamental way, which is completely ...

EmgucvOCR 字符识别，可识别英文和中文字符: EmgucvOCR 字符识别，可识别英文和中文字符，非源码，C#编写的软件，需要源码私聊，内部包含中英文字库文件，导入带文字的图片即可自动识别，识别率非常高，调用开源Emgucv，不需要训练字符，直接识别，可下载下来...

java 识别图片中英文: java 识别图片中英文，ocr智能图文识别 tess4j 图文,验证码识别,支持中英文

中英文混合文章识别问题: 非常好的中英文混合文章识别问题，哈哈非常好的中英文混合文章识别问题非常好的中英文混合文章识别问题

c#中英文二维码识别: 就是支持中英文二维码识别，winform webform的，大大的良心

快速识别翻译中英文，: 这一一款绿色版无需安装，当你有不会的英文不再需要复制然后在粘贴到百度翻译，谷歌翻译，只需要扫描识别一下就会快速帮你翻译，准确率杠杠的

离线语音评测（语音评价）及语音识别（中文英文: 离线语音评测（语音评价）及语音识别（中文英文 [注：本内容来自网络，在此分享仅为帮助有需要的网友，如果侵犯了您的权利，麻烦联系我，我会第一时间删除，谢谢您。]

验证码识别，中文验证码识别，汉字验证码识别开发: 可以识别中文验证码的软件提供下载，中文验证码、数字验证码、中英文混合验证码，都可以识别，功能挺强大的

C#中英文语音识别代码: 该代码可以实现中英文的语音识别，当输入字符时，会发出标准的读音。

模式识别与机器学习中英文版本PRML.zip: 模式识别与机器学习PRML 中英皆有

计算机语音情感识别的中英文翻译: 对照翻译 BP神经网络语音情感识别计算机毕业设计

Global site tag (gtag.js) - Google Analytics