php 基础函数 ltrim 处理中文问题

问答 / 1 / 5 / 创建于 5年前 / 更新于 5年前

今天写代码时遇到一个问题，如图所示

很明显「啊」这个字被 “吞” 掉了一个字符，搜索半天未能分析其原因。

ps: 不是找解决方案，我知道替代方案，发这个贴就是想问下 ltrim 为什么会出现这个问题。ps: 不是找解决方案，我知道替代方案，发这个贴就是想问下 ltrim 为什么会出现这个问题。

另外顺便问下，我这里怎么没有提个问题了，我还是找浏览器历史记录才发出这个问题。
php 基础函数 ltrim 处理中文问题

codeover.cn

荒街！

Laravel 8.x 译者 410 声望

暂无个人描述~

0 人点赞

从小程序个人账户申请开始，带你一步步进行开发一个微信小程序，直到提交微信控制台上线发布。

从零开始带你一步步开发一个 Go 博客项目，让你在最短的时间内学会使用 Go 进行编码。项目结构很大程度上参考了 Laravel。

推荐文章：

更多推荐...

博客

花了四个月打磨的 Laravel Plus 开源 35 / 104 |

博客

PHP 程序员转 Go 语言的经历分享 19 / 13 |

博客

手摸手带你使用 docker-compose 编排一个开发环境 22 / 15 |

工作

[求职] 重生之不再做PHP 12 / 83 |

博客

冯老师的困惑 —— PHP 挂了 21 / 4 |

博客

PHP使用yield 读取超大型目录、大目录的方法 16 / 15 |

讨论数量: 5

yema

218 声望 / 种地的 @ 俺们村

str_replace('河南省郑州市金水区','','河南省郑州市金水区啊啊')

5年前评论

荒街！

Laravel 8.x 译者 410 声望

file
仔细审题呀兄弟，我也能列出 N 种替代方案，但是发出此贴主要还是想知道为什么 ltrim 会出错。@yema

5年前评论

梧桐树下

70 声望

多字节编码导致的，涉及中文和英文的操作函数都推荐使用 mb_ 前缀函数。

5年前评论

荒街！（楼主）

我知道可以使用 mb_ 函数代替，但是我发此贴并非寻找解决方案，我自己也能列出 N 种解决方案。至于多字节编码导致，我认为前后两行代码不至于编码不同吧？

梧桐树下（作者）

@荒街！你运行一下这条语句php -r "var_dump(ltrim('Hello Worldddd', 'Hello World'));"会发现返回的值是空字符串,所以第二个参数是会转换成一个字节的方式去匹配的，多字节是由多个单字节组成的，结合 @javalaw 的说法就是你的问题了。

荒街！（楼主）

@dengminfeng 如果说是转换成字节或者 unicode编码来匹配的话，那么一个我那段代码也会返回空字符串。

梧桐树下（作者）

@荒街！ unicode编码转为ascii码，一般的utf-8由三个字节组成的，你转一下就知道了

javalaw

课程读者 93 声望

说一下我的想法：trim的第二个参数其实是字符列表，而trim函数其实并不认unicode字符，因此它会按照固定的字节数依次读取这个中文字符串，而“啊啊”第一个“啊”的前半部分unicode编码满足了trim解析的这个列表中的数据，因此被trim掉了，而“啊”unicode编码的后半部分并不满足这个列表中的任何一个部分，因此被保留下来，从而成为了乱码。

5年前评论

荒街！（楼主）

实际上并非是此问题，金水区的 unicode 编码为 \u91d1\u6c34\u533a ，啊为 \u554a ，还是有较大区别的，而且并非是只有 "啊" 才这样，是所有的中文都这样。

荒街！（楼主）

另外只有 ltrim 会出此问题，rtrim 并不会，即清除左边的内容会多清除一个字符，右边则不会

荒街！

Laravel 8.x 译者 410 声望

受 @dengminfeng 启发，将 区 与 啊 转换为 字节 后，得出 区 为 0xe5 0x8c 0xba 三字节组成，而 啊 则是由 0xe5 0x95 0x8a 组成，由于有共同的 0xe5，所以会多除去一个字节，导致乱码。

同时发现，所有中文字符的第一字节均为 0xe5 或 0xe6，所以 "区" 后无论跟任何中文字符，都会多除去一个字节。

5年前评论

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助

php 基础函数 ltrim 处理中文问题

ps: 不是找解决方案，我知道替代方案，发这个贴就是想问下 ltrim 为什么会出现这个问题。ps: 不是找解决方案，我知道替代方案，发这个贴就是想问下 ltrim 为什么会出现这个问题。

推荐文章：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

php 基础函数 ltrim 处理中文问题

ps: 不是找解决方案，我知道替代方案，发这个贴就是想问下 ltrim 为什么会出现这个问题。ps: 不是找解决方案，我知道替代方案，发这个贴就是想问下 ltrim 为什么会出现这个问题。

推荐文章：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

请登录