1,什么是gbk和utf-8编码?
2,GBK与UTF-8的区别?
1,GBK的文字编码是双字节来表示的,即不论中、英文字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。
至于UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。
2,GBK包含全部中文字符;
UTF8是国际编码,它的通用性比较好,UTF-8则包含全世界所有国家需要用到的字符。
GBK是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大~
GB2312是GBK的子集,GBK是GB18030的子集
GBK是包括中日韩字符的大字符集合
支持就能正常观看你的文字而不会出现乱码。
用UIWebview打开txt文件有时候会出现乱码的情况,这种情况应该是txt的编码问题,解决方案如下:
webview打开网页有这三个方法:
- (void)loadRequest:(NSURLRequest *)request;
- (void)loadHTMLString:(NSString *)string baseURL:(NSURL *)baseURL;
- (void)loadData:(NSData *)data MIMEType:(NSString *)MIMEType textEncodingName:(NSString *)textEncodingName baseURL:(NSURL *)baseURL;
baseUrl是什么?
也就是data中有一些链接是图片,css都是外部文件,然后这些文件需要到一个目录上去找。baseUrl就是这个目录。
1,设置baseUrl
NSArray *paths = NSSearchPathForDirectoriesInDomains(NSDocumentDirectory, NSUserDomainMask, YES);
NSString *documentsDir = [paths objectAtIndex:0] ;
//根据自己的具体情况设置,我的html文件在document目录,链接也是在这个目录上开始
NSURL *baseUrl = [NSURL fileURLWithPath:documentsDir];
2,MIMEType的黑魔法?
既文件的指定类型。
UTI和MIME的概念
同一类型标识符(Uniform Type Identifier,UTI)代表IOS信息共享的中心组件。可以把它看成下一代的MIME类型。UTI是标识资源类型(比如图像和文本)的字符串,他们制定哪些类型的信息将用于公共数据对象,他们不需要依赖于老式的指示符,比如文件扩展名,MIME类型,或者文件类型的元数据。
MIME(Multipurpose Internet Mail Extensions)多用途互联网邮件扩展类型。是设定某种扩展名的文件用一种应用程序来打开的方式类型,当该扩展名文件被访问的时候,浏览器会自动使用指定应用程序来打开。多用于指定一些客户端自定义的文件名,以及一些媒体文件打开方式。
//后缀名字符串转化为UTI字符串
CFStringRef UTI = UTTypeCreatePreferredIdentifierForTag(kUTTagClassFilenameExtension, fileExtension, NULL);
//使用UITypeCopyPreferredTagWithClass(),是UTI字符串转化为后缀扩展名,这里是转换UTI字符串转化为MIME类型
CFStringRefmimeType = UTTypeCopyPreferredTagWithClass(UTI, kUTTagClassMIMEType);
//释放
CFRelease(UTI);
CFBridgingRelease(mimeType);
3,编码类型(textEncodingName)
@"GBK" 既gbk编码方式
@"utf-8" 既utf-8编码方式
前两种方法实现中文解码如下:
- (void)loadRequest:(NSURLRequest *)request;
- (void)loadHTMLString:(NSString *)string baseURL:(NSURL *)baseURL;
txt分带编码和不带编码两种,带编码的如UTF-8格式txt,不带编码的如ANSI格式txt。带编码的用NSString的stringWithContentsOfFile可读出,不带的,我们依次尝试GBK和GB18030编码。
NSStringEncoding *useEncoding = nil;
NSString *urlString = [NSString stringWithContentsOfFile:[self.file fileDataLocalPath] encoding:useEncoding error:nil];
//按gbk的方式解码;
if (urlString) {
urlString = [NSString stringWithContentsOfFile:[self.file fileDataLocalPath] encoding:0x80000632 error:nil];
}
if (urlString) {
//将解码的贴到webview上
[self.previewWebView loadHTMLString:urlString baseURL:nil];
} else {
//如果gbk解码不成功,尝试utf-8解码,NSUTF8StringEncoding
urlString = [urlString stringByAddingPercentEscapesUsingEncoding:0x80000632];
NSURL *requesurl = [NSURL URLWithString:urlString];
NSURLRequest *request = [NSURLRequest requestWithURL:requesurl];
//用第一种方式加载
[self.previewWebView loadRequest:request];
}
第三种方式:
//同一类型标识符
CFStringRef UTI = UTTypeCreatePreferredIdentifierForTag(kUTTagClassFilenameExtension, fileExtension, NULL);
CFStringRef mimeType = UTTypeCopyPreferredTagWithClass(UTI, kUTTagClassMIMEType);
CFRelease(UTI);
CFBridgingRelease(mimeType);
//GBK解码
[self.previewWebView loadData:previewData MIMEType:(__bridge NSString *)(mimeType) textEncodingName:@"GBK" baseURL:nil];
iOS中utf-8国际通用编码有时会出现乱码情况,用gbk国家编码可以很好支持中文编码。
如果应用在国内gbk编码的方式基本通用,但是国外受环境限制易造成乱码,utf全球通用有时会出现本地支持不好情况;
出现乱码的原因在于使用编码的不同环节之间支持的编码不一样。