C++ Builder 参考手册 ➙ System::Sysutils ➙ CharLength
字符串里面从某个编码单元开始的字符的字节数
头文件:#include <System.SysUtils.hpp>
命名空间:System::Sysutils
函数原型:
int __fastcall CharLength(const System::UnicodeString S, int Index);
参数:
- S:字符串;
- Index:编码单元序号,从 1 到 n,n 为字符串长度;由于 UnicodeString 是 UTF-16 编码的,编码单元为 char16_t (或 wchar_t),由于一个字符可能由 1 个或 2 个 char16_t 组成的,一个字符是 2 或 4 个字节;
返回值:
- 2: 在 Index 位置的字符是单个编码的字符 (2 个字节的字符),或者半个字符位置 (这是单个编码单元的字符,或者与前面的编码单元组成一个字符);
- 4: 在 Index 位置的字符是两个编码单元的字符 (4 个字节的字符);
- 字符串 L"Hello玄坴" 长度为 7,即包含 7 个编码单元,14 个字节,包含的字符个数是 7 个字符;
- 字符串 L"土𪢴圭垚𡋣㙓" 长度为 8,即包含 8 个编码单元,16 个字节,包含的字符个数是 6 个字符,其中 "土"、"圭"、"垚" 和 "㙓" 都是单个编码单元的字符 (2个字节),"𪢴" 和 "𡋣" 是两个编码单元的字符 (4个字节)。
例子:输出字符串 L"土𪢴圭垚𡋣㙓" 里面每个 char16_t 位置开始的字符是几个字节;
void __fastcall TForm1::Button1Click(TObject *Sender)
{
UnicodeString s = L"土𪢴圭垚𡋣㙓";
int n = s.Length();
for(int i=1; i<=n; i++)
{
Memo1->Lines->Add(String().sprintf(L"%d:%d",i,Sysutils::CharLength(s,i)));
}
}
运行结果:
通过运行结果可以看到:
- "土"、"圭"、"垚" 和 "㙓" 都是单个编码单元的字符 (2个字节),"𪢴" 和 "𡋣" 是两个编码单元的字符 (4个字节);
- 序号 Index 在半个字符位置返回结果为 2,否则返回 2 (单个编码单元的字符) 或 4 (两个编码单元的字符)。
相关:
- System::Sysutils::ByteToCharIndex
- System::Sysutils::BytesOf
- System::Sysutils::WideBytesOf
- System::Sysutils::PlatformBytesOf
- System::Sysutils::StringOf
- System::Sysutils::WideStringOf
- System::Sysutils::PlatformStringOf
- System::Sysutils::ByteLength
- System::Sysutils::CharLength
- System::Sysutils::StrCharLength
- System::Sysutils::AnsiLastChar
- System::Sysutils::AnsiStrLastChar
- System::Sysutils::AnsiPos
- System::Sysutils::AnsiStrPos
- System::Sysutils::AnsiStrScan
- System::Sysutils::AnsiStrRScan
- System::Sysutils::CharToElementIndex
- System::Sysutils::CharToElementLen
- System::Sysutils::ElementToCharIndex
- System::Sysutils::ElementToCharLen
- System::Sysutils
- std::mblen
- std::_mbstrlen
- <cstdlib>
- std::strlen, std::_fstrlen, std::_tcslen, std::wcslen
- <cstring>
C++ Builder 参考手册 ➙ System::Sysutils ➙ CharLength