博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
java 中文转换成Unicode编码和Unicode编码转换成中文
阅读量:5818 次
发布时间:2019-06-18

本文共 2979 字,大约阅读时间需要 9 分钟。

转自:一叶飘舟http://blog.csdn.net/jdsjlzx/article/details/7058823

 

package lia.meetlucene;import java.io.IOException;import org.apache.lucene.index.CorruptIndexException;public class Unicode {    public static void main(String[] args) throws CorruptIndexException,            IOException {        String s = "简介";        String tt = gbEncoding(s); // String tt1 = "你好,我想给你说一个事情";        System.out.println("unicodeBytes is: " + tt);        // 输出“简介”的unicode编码        System.out.println("对应的中文: " + decodeUnicode("\\u7b80\\u4ecb")); // System.out.println(decodeUnicode(tt1));        // 输出unicode编码对应的中文        System.out.println("~~~~~~~~~~~~~~~~~~~~~~~~~~~~~");        System.out.println(s.indexOf("\\"));    }    public static String gbEncoding(final String gbString) {        char[] utfBytes = gbString.toCharArray();        String unicodeBytes = "";        for (int byteIndex = 0; byteIndex < utfBytes.length; byteIndex++) {            String hexB = Integer.toHexString(utfBytes[byteIndex]);            if (hexB.length() <= 2) {                hexB = "00" + hexB;            }            unicodeBytes = unicodeBytes + "\\u" + hexB;        }        return unicodeBytes;    }    public static String decodeUnicode(final String dataStr) {        int start = 0;        int end = 0;        final StringBuffer buffer = new StringBuffer();        while (start > -1) {            end = dataStr.indexOf("\\u", start + 2);            String charStr = "";            if (end == -1) {                charStr = dataStr.substring(start + 2, dataStr.length());            } else {                charStr = dataStr.substring(start + 2, end);            }            char letter = (char) Integer.parseInt(charStr, 16); // 16进制parse整形字符串。            buffer.append(new Character(letter).toString());            start = end;        }        return buffer.toString();    }}

 

 

代码详解:

public static String decodeUnicode(final String dataStr) {        int start = 0;        int end = 0;        final StringBuffer buffer = new StringBuffer();        while (start > -1) {            end = dataStr.indexOf("\\u", start + 1);            //使得第一个unicode在start~end之间,+1,+2,+3均可            System.out.println(start + "asdfasd~~~~~~~~~~~~~~~~~~~~~``" + end);            // the index of the first occurrence of the specified substring,            // starting at the specified index,            // or -1 if there is no such occurrence.            String charStr = "";            if (end == -1) {                charStr = dataStr.substring(start + 2, dataStr.length());            } else {                charStr = dataStr.substring(start + 2, end);            }            char letter = 0;            if (charStr.length() == 4) {                letter = (char) Integer.parseInt(charStr, 16); // 16进制parse整形字符串。            }            //防止出错            buffer.append(new Character(letter).toString());            start = end;        }        return buffer.toString();    }

 

转载于:https://www.cnblogs.com/XDJjy/p/4353802.html

你可能感兴趣的文章
poj2774
查看>>
centos7安装sonarqube6.7 代码质量管理平台
查看>>
CentOS 6.5 下编译安装 Nginx 1.8.0
查看>>
tomcat安装完设定用户名和密码
查看>>
何必言精通——十年杂感(转载)
查看>>
HTML5 Video与Audio 视频与音频
查看>>
DataFrame
查看>>
Android UiAutomator UiDevice API
查看>>
Codeforces 372B Counting Rectangles is Fun
查看>>
函数式对象之私有字段和方法
查看>>
PSP总结报告
查看>>
[学习笔记]计算几何
查看>>
Windows下Apache整合Tomcat成功实例
查看>>
html5圆角
查看>>
spring整合ssmXML版
查看>>
导出excel身份证过长导致显示不正常自定义单元格格式解决方法
查看>>
VMX指令集
查看>>
Spark数据倾斜及解决方案
查看>>
IIS问题大全
查看>>
关于多项式的一些东西
查看>>