欢迎来到天天文库
浏览记录
ID:9083259
大小:20.50 KB
页数:2页
时间:2018-04-16
《用strcoll实现中文按拼音排序》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、用strcoll实现中文按拼音排序C语言从C94引入多语言支持以后处理中文方便多了。即使不用wchar_t也可以获得很多好处,比如增加了strcoll这个根据locale比较字符串的函数。简单地说,一个locale就是一组处理跟语言相关问题的规则,这里有一篇简介。这些规则就包括如何对字符串进行比较和排序。按照C94及C99标准的规定,程序在启动时设置locale为"C"。在"C"locale下,字符串的比较就是按照内码一个字节一个字节地进行,这时strcoll与strcmp函数没有区别。在其他locale
2、下,字符串的比较方式则不同了,例如在简体中文locale下,strcmp仍然按内码比较,而strcoll对于汉字则是按拼音进行的(这也跟操作系统有关,Windows还支持按笔划排序,可以在“区域和语言设置”里面修改)。在C语言里面,用setlocale函数设置当前locale,在程序开头使用一句setlocale(LC_ALL,"");就可以了。第二个参数为空串表示依照操作系统的当前设置。下面是一个示例程序(须使用C编译器;如果要用C++编译器,还要自己封装一下strcoll或者加一个强制类型转换):#i
3、nclude#include#include#includeintmain(void){inti;charstr[10][4]={"镕","堃","趙","錢","孫","李","周","吳","鄭","王"};qsort(str,10,4,strcoll);printf("按内码排序:");for(i=0;i<10;i++)printf("%s",str[i]);setlocale(LC_ALL,"");qsort(str,1
4、0,4,strcoll);printf("按音序排序:");for(i=0;i<10;i++)printf("%s",str[i]);return0;}程序输出(操作系统GNU/Linux,locale为"zh_CN.UTF-8"):按内码排序:吳周堃孫李王趙鄭錢镕按音序排序:堃李錢镕孫王吳趙鄭周程序输出(操作系统Windows,locale为"Chinese_People'sRepublicofChina.936"):按内码排序:吳堃孫李王周趙鄭錢镕按音序排序:堃李錢镕孫王吳趙鄭周按内码排序的差别是
5、因为两个测试里使用了不同的内码,但可以看出第二行的结果相同。之所以用了生僻字和繁体字为例,是因为一级汉字在GB2312里面恰好是按拼音排的,体现不出差别了。另外,使用宽字符(wchar_t)的程序在开头一定要使用setlocale,不然会遇到很多麻烦,比如wprintf不能输出中文……
此文档下载收益归作者所有