开启生长之旅!这是我参加「日新计划 2 月更文挑战」的第 3 天,点击检查活动概况

字符操作

编码与解码

编码便是把字符转换为字节,而解码是把字节从头组合成字符。

假如编码和解码过程运用不同的编码方法那么就出现了乱码。

  • GBK 编码中,中文字符占 2 个字节,英文字符占 1 个字节;
  • UTF-8 编码中,中文字符占 3 个字节,英文字符占 1 个字节;
  • UTF-16be 编码中,中文字符和英文字符都占 2 个字节。

UTF-16be 中的 be 指的是 Big Endian,也便是大端。相应地也有 UTF-16le,le 指的是 Little Endian,也便是小端。

Java 的内存编码运用双字节编码 UTF-16be,这不是指 Java 只支撑这一种编码方法,而是说 char 这种类型运用 UTF-16be 进行编码。char 类型占 16 位,也便是两个字节,Java 运用这种双字节编码是为了让一个中文或者一个英文都能运用一个 char 来存储。

String 的编码方法

String 能够看成一个字符序列,能够指定一个编码方法将它编码为字节序列,也能够指定一个编码方法将一个字节序列解码为 String。

String str1 = "中文";
byte[] bytes = str1.getBytes("UTF-8");
String str2 = new String(bytes, "UTF-8");
System.out.println(str2);

在调用无参数 getBytes() 方法时,默许的编码方法不是 UTF-16be。双字节编码的好处是能够运用一个 char 存储中文和英文,而将 String 转为 bytes[] 字节数组就不再需求这个好处,因而也就不再需求双字节编码。getBytes() 的默许编码方法与渠道有关,一般为 UTF-8。

byte[] bytes = str1.getBytes();

Reader 与 Writer

不管是磁盘还是网络传输,最小的存储单元都是字节,而不是字符。可是在程序中操作的通常是字符形式的数据,因而需求供给对字符进行操作的方法。

  • InputStreamReader 完成从字节流解码成字符流;
  • OutputStreamWriter 完成字符流编码成为字节流。

完成逐行输出文本文件的内容

public static void readFileContent(String filePath) throws IOException {
​
  FileReader fileReader = new FileReader(filePath);
  BufferedReader bufferedReader = new BufferedReader(fileReader);
​
  String line;
  while ((line = bufferedReader.readLine()) != null) {
    System.out.println(line);
   }
​
  // 装修者形式使得 BufferedReader 组合了一个 Reader 目标
  // 在调用 BufferedReader 的 close() 方法时会去调用 Reader 的 close() 方法
  // 因而只要一个 close() 调用即可
  bufferedReader.close();
}

目标操作

序列化

序列化便是将一个目标转换成字节序列,方便存储和传输。

  • 序列化:ObjectOutputStream.writeObject()
  • 反序列化:ObjectInputStream.readObject()

不会对静态变量进行序列化,由于序列化仅仅保存目标的状况,静态变量属于类的状况。

Serializable

序列化的类需求完成 Serializable 接口,它仅仅一个规范,没有任何方法需求完成,可是假如不去完成它的话而进行序列化,会抛出异常。

public static void main(String[] args) throws IOException, ClassNotFoundException {
​
  A a1 = new A(123, "abc");
  String objectFile = "file/a1";
​
  ObjectOutputStream objectOutputStream = new ObjectOutputStream(new FileOutputStream(objectFile));
  objectOutputStream.writeObject(a1);
  objectOutputStream.close();
​
  ObjectInputStream objectInputStream = new ObjectInputStream(new FileInputStream(objectFile));
  A a2 = (A) objectInputStream.readObject();
  objectInputStream.close();
  System.out.println(a2);
}
​
private static class A implements Serializable {
​
  private int x;
  private String y;
​
  A(int x, String y) {
    this.x = x;
    this.y = y;
   }
​
  @Override
  public String toString() {
    return "x = " + x + "  " + "y = " + y;
   }
}

transient

transient 关键字能够使一些属性不会被序列化。

ArrayList 中存储数据的数组 elementData 是用 transient 润饰的,由于这个数组是动态扩展的,并不是一切的空间都被运用,因而就不需求一切的内容都被序列化。通过重写序列化和反序列化方法,使得能够只序列化数组中有内容的那部分数据。

private transient Object[] elementData;