NSString简单细说(二十一)—— 字符串与编码

版本记录

版本号 时间
V1.0 2017.06.30

前言

前面我简单的写了些NSString的初始化,写了几篇,都不难,但是可以对新手有一定的小帮助,对于大神级人物可以略过这几篇,NSString本来就没有难的,都是细枝末节,忘记了查一下就会了,没有技术难点,下面我们继续~~~
1. NSString简单细说(一)—— NSString整体架构
2. NSString简单细说(二)—— NSString的初始化
3. NSString简单细说(三)—— NSString初始化
4. NSString简单细说(四)—— 从URL初始化
5. NSString简单细说(五)—— 向文件或者URL写入
6. NSString简单细说(六)—— 字符串的长度
7. NSString简单细说(七)—— 与C字符串的转化
8. NSString简单细说(八)—— 识别和比较字符串
9. NSString简单细说(九)—— 字符串的合并
10. NSString简单细说(十)—— 字符串的分解
11. NSString简单细说(十一)—— 字符串的查找
12. NSString简单细说(十二)—— 字符串的替换
13. NSString简单细说(十三)—— 字符串的分行和分段
14. NSString简单细说(十四)—— 字符串位置的计算
15. NSString简单细说(十五)—— 字符串转化为propertyList
16. NSString简单细说(十六)—— 画字符串
17. NSString简单细说(十七)—— 字符串的折叠和前缀
18. NSString简单细说(十八)—— 字符串中大小写子母的变换
19. NSString简单细说(十九)—— 根据映射获取字符串
20. NSString简单细说(二十)—— 获取字符串的数值
这一篇我们说一下字符串与编码

字符串与编码

一、+ (NSStringEncoding)stringEncodingForData:(NSData *)data encodingOptions:(NSDictionary<NSStringEncodingDetectionOptionsKey,id> *)opts convertedString:(NSString * _Nullable *)string usedLossyConversion:(BOOL *)usedLossyConversion;

下面我们看一下这几个参数。

参数表

下面我们详细说一下

  • data:一个NSData对象,包含具有特定编码方式的字节。
  • opts:决定字符串编码时使用的选项,是一个字典,其中键为NSStringEncodingDetectionOptionsKey。
NSStringEncodingDetectionSuggestedEncodingsKey
NSStringEncodingDetectionDisallowedEncodingsKey
NSStringEncodingDetectionUseOnlySuggestedEncodingsKey
NSStringEncodingDetectionAllowLossyKey
NSStringEncodingDetectionFromWindowsKey
NSStringEncodingDetectionLossySubstitutionKey
NSStringEncodingDetectionLikelyLanguageKey
  • string:如果能够决定一种字符串编码,则会返回根据特定编码由data转化来的字符串对象。
  • usedLossyConversion:是否使用有损转化,如果一种字符串的编码被确定,就会返回一种BOOL值,这个BOOL值与是否使用有损转化有关。
    -return:返回值为NSStringEncoding,或者如果字符串编码不能确定的话就会返回0。

下面还是直接看代码。

    /**
     * 1. + (NSStringEncoding)stringEncodingForData:(NSData *)data encodingOptions:(NSDictionary<NSStringEncodingDetectionOptionsKey,id> *)opts convertedString:(NSString * _Nullable *)string usedLossyConversion:(BOOL *)usedLossyConversion;
     *
     *  @param data:An NSData object containing bytes in an encoding to be determined.
     *  @param opts:Options to use when attempting to determine the string encoding. See String Encoding Detection Options for a full list of supported options.
     *  @param string:If a string encoding could be determined, upon return contains an NSString object constructed from data using the determined string encoding.
     *  @param usedLossyConversion:If a string encoding could be determined, upon return contains a BOOL value corresponding to whether lossy conversion was used.
     *
     *  @return:An NSStringEncoding value, or 0 if a string encoding could not be determined.
     *
     */
    
    const void *bytes = "ADDSDDSD";
    BOOL isLossy = YES;
    NSData *data = [NSData dataWithBytes:bytes length:5];
    [NSString stringEncodingForData:data encodingOptions:NSStringEncodingDetectionAllowLossyKey convertedString:@"MMMMM" usedLossyConversion:&isLossy];

这个运行需要在MRC下使用,但是运行起来还是崩溃了,是下面这个问题,这个方法我还不怎么会,知道的请和我说下,谢谢。

** Terminating app due to uncaught exception 'NSInvalidArgumentException', reason: '-[__NSCFConstantString objectForKey:]: unrecognized selector sent to instance 0x108b22710'

结论:希望知道的@我。


二、- (BOOL)canBeConvertedToEncoding:(NSStringEncoding)encoding;

该方法会返回一个bool值,用来说明字符串是否可以进行无损转换。

  • 返回值:如果可以进行编码无损转化会返回YES,在转化的过程中,如果字符要被改变或者删除就会返回NO。如果你打算转化字符串,方法dataUsingEncoding:...失败的时候会返回nil,可以避免提前调用这个方法失败。

下面看代码。

    /**
     * 2. - (BOOL)canBeConvertedToEncoding:(NSStringEncoding)encoding;
     *
     *  @param encoding:A string encoding. For possible values, see NSStringEncoding.
     *
     *  @return:YES if the receiver can be converted to encoding without loss of information. Returns NO if characters would have to be changed or deleted in the process of changing encodings.
     *
     */
    
    NSString *str = @"ABCDEFGHI";
    BOOL isSuccess = [str canBeConvertedToEncoding:NSUTF8StringEncoding];
    NSLog(@"isSuccess = %d",isSuccess);

下面看输出结果。

2017-06-30 23:31:56.639 NSString你会用吗?[1955:83829] isSuccess = 1

结论:这个方法还算简单。


三、- (NSData *)dataUsingEncoding:(NSStringEncoding)encoding;

这个方法返回的是一个根据给定编码方式的NSData对象,本方法和dataUsingEncoding:allowLossyConversion:中第二个参数传入NO是一样的,下面看代码。

    /**
     * 3. - (NSData *)dataUsingEncoding:(NSStringEncoding)encoding;
     *
     *  @param encoding:A string encoding. For possible values, see NSStringEncoding.
     *
     *  @return:The result of invoking dataUsingEncoding:allowLossyConversion: with NO as the second argument (that is, requiring lossless conversion).
     *
     */
    
    NSString *str = @"ABCDEFGHI";
    NSData *data = [str dataUsingEncoding:NSUTF8StringEncoding];
    NSLog(@"data = %@",data);
    
    NSString *str1 = [[NSString alloc] initWithData:data encoding:NSUTF8StringEncoding];
    NSLog(@"str1 = %@",str1);

下面看输出结果。

2017-06-30 23:43:53.368 NSString你会用吗?[2123:92867] data = <41424344 45464748 49>
2017-06-30 23:43:53.369 NSString你会用吗?[2123:92867] str1 = ABCDEFGHI

结论:这个方法也还好。


四、- (NSData *)dataUsingEncoding:(NSStringEncoding)encoding allowLossyConversion:(BOOL)lossy;

下面看一下参数

  • encoding:编码方式,是一个枚举值就不多说了。
  • flag:如果是YES,则在转换中允许字符串被移除和替换。
  • return:包含特定编码格式的NSData对象,如果标志位为NO,和不能进行无损转化,例如重音符和大小写,就会返回nil。

注意:如果标志位为YES,并且不能进行无损转化时,一些字符串可能在转换中被移除和替换,例如,在NSUnicodeStringEncoding和NSASCIIStringEncoding转换中,字符‘Á’ 会变成 ‘A’,失去重音。

下面还是看代码。

    /**
     * 4. - (NSData *)dataUsingEncoding:(NSStringEncoding)encoding allowLossyConversion:(BOOL)lossy;
     *
     *  @param encoding:A string encoding. For possible values, see NSStringEncoding.
     *
     *  @return:The result of invoking dataUsingEncoding:allowLossyConversion: with NO as the second argument (that is, requiring lossless conversion).
     *
     */
    
    NSString *str = @"ABCDEFGHI";
    NSData *data = [str dataUsingEncoding:NSUTF8StringEncoding allowLossyConversion:YES];
    NSString *str1 = [[NSString alloc] initWithData:data encoding:NSUTF8StringEncoding];
    NSLog(@"str1 = %@",str1);
    
    NSData *data1 = [str dataUsingEncoding:NSUTF8StringEncoding allowLossyConversion:NO];
    NSString *str2 = [[NSString alloc] initWithData:data1 encoding:NSUTF8StringEncoding];
    NSLog(@"str2 = %@",str2);

下面看输出结果

2017-06-30 23:56:42.384 NSString你会用吗?[2259:102572] str1 = ABCDEFGHI
2017-06-30 23:56:42.385 NSString你会用吗?[2259:102572] str2 = ABCDEFGHI

注意:自己看吧。


五、+ (NSString *)localizedNameOfStringEncoding:(NSStringEncoding)encoding;

该方法会根据某个编码,返回一个人可读的字符串。

下面看代码。

    /**
     * 5. + (NSString *)localizedNameOfStringEncoding:(NSStringEncoding)encoding;
     *
     *  @param encoding:A string encoding. For possible values, see NSStringEncoding.
     *
     *  @return:A human-readable string giving the name of encoding in the current locale.
     *
     */
    
    NSString *str = @"ABCDEFGHI";

    NSString *str1 = [NSString localizedNameOfStringEncoding:NSUTF8StringEncoding];
    NSLog(@"str1 = %@",str1);

下面看结果

2017-07-01 00:01:48.972 NSString你会用吗?[2344:107655] str1 = Unicode (UTF-8)

注意:这个好理解吧。


六、@property(readonly, copy) NSString *description;

该方法返回的是NSString对象。

下面直接看代码。

    /**
     * 6.@property(readonly, copy) NSString *description;
     */
    
    NSString *str1 = @"T中国helloChina";
    NSString *str = str1.description;

下面看输出结果。

2017-07-01 00:07:49.462 NSString你会用吗?[2487:113889] str = T中国helloChina

注意:很简单。


七、@property(readonly) NSStringEncoding fastestEncoding;

该方法会返回最快的编码方式。该方法适用于字符串中字符的检索,编码方式对于空格可能不是有效的。

下面看代码。

    /**
     * 7.@property(readonly) NSStringEncoding fastestEncoding;
     */
    
    NSString *str1 = @"T中国helloChina";
    NSStringEncoding code = str1.fastestEncoding;
    NSLog(@"code = %d",code);

下面看输出结果。

2017-07-01 00:09:53.333 NSString你会用吗?[2532:116355] code = 10

下面看这个枚举值

typedef NSUInteger NSStringEncoding;
NS_ENUM(NSStringEncoding) {
    NSASCIIStringEncoding = 1,      /* 0..127 only */
    NSNEXTSTEPStringEncoding = 2,
    NSJapaneseEUCStringEncoding = 3,
    NSUTF8StringEncoding = 4,
    NSISOLatin1StringEncoding = 5,
    NSSymbolStringEncoding = 6,
    NSNonLossyASCIIStringEncoding = 7,
    NSShiftJISStringEncoding = 8,          /* kCFStringEncodingDOSJapanese */
    NSISOLatin2StringEncoding = 9,
    NSUnicodeStringEncoding = 10,
    NSWindowsCP1251StringEncoding = 11,    /* Cyrillic; same as AdobeStandardCyrillic */
    NSWindowsCP1252StringEncoding = 12,    /* WinLatin1 */
    NSWindowsCP1253StringEncoding = 13,    /* Greek */
    NSWindowsCP1254StringEncoding = 14,    /* Turkish */
    NSWindowsCP1250StringEncoding = 15,    /* WinLatin2 */
    NSISO2022JPStringEncoding = 21,        /* ISO 2022 Japanese encoding for e-mail */
    NSMacOSRomanStringEncoding = 30,
    NSUTF16StringEncoding = NSUnicodeStringEncoding,      /* An alias for NSUnicodeStringEncoding */
    NSUTF16BigEndianStringEncoding = 0x90000100,          /* NSUTF16StringEncoding encoding with explicit endianness specified */
    NSUTF16LittleEndianStringEncoding = 0x94000100,       /* NSUTF16StringEncoding encoding with explicit endianness specified */
    NSUTF32StringEncoding = 0x8c000100,                   
    NSUTF32BigEndianStringEncoding = 0x98000100,          /* NSUTF32StringEncoding encoding with explicit endianness specified */
    NSUTF32LittleEndianStringEncoding = 0x9c000100        /* NSUTF32StringEncoding encoding with explicit endianness specified */
};

结论: NSUnicodeStringEncoding就是最快的编码方式。


八、@property(readonly) NSStringEncoding smallestEncoding;

该编码方式也许不是最快的获取字符的方法,但是对空格有效的,这个属性获取字符时会消耗一段时间。

下面看代码。

    /**
     * 8.@property(readonly) NSStringEncoding smallestEncoding;
     */
    
    NSString *str1 = @"T中国helloChina";
    NSStringEncoding code = str1.smallestEncoding;
    NSLog(@"code = %d",code);

下面看输出结果。

2017-07-01 00:19:58.240 NSString你会用吗?[2663:123886] code = 10

结论:和七的方法返回的编码方式是一样的。

后记

未完,待续~~~

花海
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,843评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,538评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,187评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,264评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,289评论 6 390
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,231评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,116评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,945评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,367评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,581评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,754评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,458评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,068评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,692评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,842评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,797评论 2 369
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,654评论 2 354

推荐阅读更多精彩内容