C++ Builder 参考手册 ➙ System::Sysutils ➙ NextCharIndex
字符串里面下一个字符是从第几个编码单元开始的
头文件:#include <System.SysUtils.hpp>
命名空间:System::Sysutils
函数原型:
int __fastcall NextCharIndex(const System::UnicodeString S, int Index);
参数:
- S:字符串;
- Index:编码单元索引,从 1 开始为第 1 个编码单元,UnicodeString 的编码单元为 char16_t (或 wchar_t),由于一个字符可能由 1 个或 2 个 char16_t 组成的,所以第 n 个 char16_t 不一定是第 n 个字符;
返回值:
- 字符串 S 里面第 Index 个编码单元 (char16_t) 所在字符的下一个字符是从第几个编码单元开始的;
- 在 UnicodeString 里面通常每个英文字符和常用汉字和符号是一个 char16_t,一些不常用的汉字和符号两个 char16_t。
例子:
- UnicodeString 字符串 L"土𪢴圭垚𡋣㙓" 当中第 2 和第 3 个 char16_t 组成第 2 个字符 "𪢴",第 6 和第 7 个 char16_t 组成第 5 个字符 "𡋣",其他的字符都是单个 char16_t 的字符;
UnicodeString S = L"土𪢴圭垚𡋣㙓";
字符 | 编码单元序号 |
---|---|
土 | 1 |
𪢴 | 2, 3 |
圭 | 4 |
垚 | 5 |
𡋣 | 6, 7 |
㙓 | 8 |
NextCharIndex(S, 1) 等于 2,第 1 个编码单元位置的 '土' 的下一个字符 '𪢴' 是从第 2 个编码单元开始的;
NextCharIndex(S, 2) 等于 4,第 2 个 编码单元位置的 '𪢴' 的下一个字符 '圭' 是从第 4 个编码单元开始的;
NextCharIndex(S, 3) 等于 4,第 3 个 编码单元位置的 '𪢴' 的下一个字符 '圭' 是从第 4 个编码单元开始的;
NextCharIndex(S, 4) 等于 5,第 4 个 编码单元位置的 '圭' 的下一个字符 '垚' 是从第 5 个编码单元开始的。
相关:
- System::Sysutils::CharToElementIndex
- System::Sysutils::CharToElementLen
- System::Sysutils::ElementToCharIndex
- System::Sysutils::ElementToCharLen
- System::Sysutils::NextCharIndex
- System::Sysutils::BytesOf
- System::Sysutils::WideBytesOf
- System::Sysutils::PlatformBytesOf
- System::Sysutils::StringOf
- System::Sysutils::WideStringOf
- System::Sysutils::PlatformStringOf
- System::Sysutils::ByteLength
- System::Sysutils::CharLength
- System::Sysutils::StrCharLength
- System::Sysutils::AnsiLastChar
- System::Sysutils::AnsiStrLastChar
- System::Sysutils::AnsiPos
- System::Sysutils::AnsiStrPos
- System::Sysutils::AnsiStrScan
- System::Sysutils::AnsiStrRScan
- System::Sysutils
- std::mblen
- std::_mbstrlen
- <cstdlib>
- std::strlen, std::_fstrlen, std::_tcslen, std::wcslen
- <cstring>
C++ Builder 参考手册 ➙ System::Sysutils ➙ NextCharIndex