`
逆风的香1314
  • 浏览: 1392876 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

深入研究 String

阅读更多
 
String是一个非可变类(immutable class),其实现采用Copy On Write技术。简单说来,非可变类的实例是不能被修改的,每个实例中包含的信息都必须在该实例创建的时候就提供出来,并且在对象的整个生存周期内固定不变。非可变类有着自身的优势,如状态单一,对象简单,便于维护;其次,该类的对象本质上是线程安全的,不要求同步。此外用户可以共享非可变对象,甚至可以共享它们的内部信息。
4.1 String对象的创建
创建一个String 对象,主要就有以下两种方式:
String str1 = new String("abc");   
String str2 = "abc";  
对于第一种,JVM会在heap中创建一个String对象,然后将该对象的引用返回给用户。对于第二种,JVM首先会在内部维护的strings pool中通过String的 equals 方法查找是对象池中是否存放有该String对象,如果有,则返回已有的String对象给用户,而不会在heap中重新创建一个新的String对象;如果对象池中没有该String对象,JVM则在heap中创建新的String对象,将其引用返回给用户,同时将该引用添加至strings pool
注意:使用第一种方法创建对象时,JVM是不会主动把该对象放到strings pool里面的,除非程序调用 String的intern方法。看下面的例子:
    String str1 = new String("abc"); //JVM 在堆上创建一个String对象   
 
    //      jvm 在strings pool中找不到值为“abc”的字符串,因此   
    //      在堆上创建一个String对象,并将该对象的引用加入至strings pool中   
    //      此时堆上有两个String对象   
    String str2 = "abc";
   
    if(str1 == str2)
    {
        System.out.println("str1 == str2");
    }
    else
    {
        System.out.println("str1 != str2");
    }
    //打印结果是 str1 != str2,因为它们是堆上两个不同的对象   
   
    String str3 = "abc";
    //      此时,jvm发现strings pool中已有“abc”对象了,因为“abc”equels “abc”   
    //      因此直接返回str2指向的对象给str3,也就是说str2和str3是指向同一个对象的引用   
    if(str2 == str3)
    {
        System.out.println("str2 == str3");
    }
    else
    {
        System.out.println("str2 != str3");
    }
//      打印结果为 str2 == str3  
 
再看下面的例子:
String str1 = new String("abc"); //JVM 在堆上创建一个String对象   
str1 = str1.intern();
// 程序显式将str1放到strings pool中,intern运行过程是这样的:首先查看strings pool   
// 有没“abc”对象的引用,没有,则在堆中新建一个对象,然后将新对象的引用加入至   
// strings pool中。执行完该语句后,str1原来指向的String对象已经成为垃圾对象了。 
// 此时,JVM发现strings pool中已有“abc”对象了,因为“abc”equals “abc”   
// 因此直接返回str1指向的对象给str2,也就是说str2和str1引用着同一个对象,   
// 此时,堆上的有效对象只有一个。   
String str2 = "abc";
 
if(str1 == str2)
{
    System.out.println("str1 == str2");
}
else
{
    System.out.println("str1 != str2");
}
//打印结果是 str1 == str2   
  为什么JVM可以这样处理String对象呢?就是因为String的非可变性。既然所引用的对象一旦创建就永不更改,那么多个引用共用一个对象时互不影响。
4.2 JVM对String常量的处理和优化
4.2.1 JVM对String的处理
class Test
{
    publicstaticvoid main(String[] args)
    {
        /*  
         * 1.字面上的 "Hi" 字符串将被自动 intern 到虚拟机的字符串池中.  
         * 2.不是字面上的String对象,通过调用intern()方法,被intern到虚拟机的字符串池中.  
         *   
         * 虚拟机的字符串池由类 String 私有地维护。   
         */
        String a = "Hi";
        String b = "Hi";
        String c = new String("Hi");
 
        System.out.println(a == b);// true   
        System.out.println(a == c);// false   
 
        c = c.intern();
        System.out.println(a == c);// true   
 
        /*  
         * 创建了两个对象   
         * 1.字面"AA" ——被intern到虚拟机字符串池中了。  
         * 2.new 操作符创建的 对象  
         *   
         * 由AA != AA.intern()可以看出:String AA = new String("AA");创建了两个对象。  
         */
        String AA = new String("AA");
        System.out.println(AA == "AA");// false   
        System.out.println(AA == AA.intern());// false   
        System.out.println("AA" == AA.intern());// true   
 
        /*  
         * JAVA 规范中的例子:  
         */
        String hello = "Hello", lo = "lo";
        System.out.println((hello == "Hello") + " "); //true   
        System.out.println((hello == ("Hel" + "lo")) + " "); //true   
        System.out.println((hello == ("Hel" + lo)) + " "); //false--lo为非literal的   
        System.out.println(hello == ("Hel" + lo).intern());//true   
    }
}
4.2.2编译器对String常量表达式的优化
4.2.2.1 问题代码
String a = "ab";
String b = "a" + "b";
System.out.println((a == b));
打印结果会是什么?一般答案会是以下几种:
(1)true
"a" + "b"的结果就是"ab",这样a,b都是"ab"了,内容一样所以"相等",结果true
一般java新人如是答。
(2)false
"a" + "b"会生成新的对象"ab",但是这个对象和String a = "ab";不同,(a == b)是比较对象引用,因此不相等,结果false 对java的String有一定了解的通常这样回答。
(3)true
String a = "ab";创建了新的对象"ab"; String b = "a" + "b";没有创建新的对象,而是从JVM字符串常量池中获取之前已经存在的"ab"对象。因此a,b具有对同一个string对象的引用,两个引用相等,结果true 能回答出这个答案的,基本已经是高手了,对java中的string机制比较了解。很遗憾,这个答案,是错误的,或者说,压根没有这么回事.
(4).true
String b = "a" + "b";编译器将这个"a" + "b"作为常量表达式,在编译时进行优化,直接取结果"ab",这样这个问题退化
String a = "ab";
String b = "ab";
System.out.println((a == b));
String b = "ab";没有创建新的对象,而是从JVM字符串常量池中获取之前已经存在的"ab"对象。因此a,b具有对同一个string对象的引用,两个引用相等,结果true
4.2.2.2.编译器优化证明过程
这里有一个疑问就是String不是基本类型,像 int secondsOfDay = 24 * 60 * 60; 这样的表达式是常量表达式,编译器在编译时直接计算容易理解,而"a" + "b" 这样的表达式,string是对象不是基本类型,编译器会把它当成常量表达式来优化吗?
下面简单证明我的推断,首先编译这个类:
public class Test {
private String a = "aa";
}
复制class文件备用,然后修改为
public class Test {
private String a = "a" + "a";
}
再次编译,用ue之类的文本编辑器打开,察看二进制内容,可以发现,两个class文件完全一致,连一个字节都不差.
真相大白了.根本不存在运行期的处理String b = "a" + "b";这样的代码的问题,编译时就直接优化掉了
4.2.2.3.扩展应用
下面进一步探讨,什么样的String + 表达式会被编译器当成常量表达式?
(1)       String + String被正式是ok的
(2)       String + int    被正式也是ok的
        String a = "a1";
        String b = "a" + 1;
        System.out.println((a == b)); //result = true
(3)       String + boolean被正式也是ok的
        String a = "atrue";
        String b = "a" + true;
        System.out.println((a == b)); //result = true
(4)       (3)    String + double被正式也是ok的
        String a = "a3.4";
        String b = "a" + 3.4;
        System.out.println((a == b)); //result = true
可见编译器string + 基本类型是当成常量表达式直接求值来优化的。
(5)     再注意看这里的String都是"**"这样的,我们换成变量来试试:
        String a = "ab";
        String bb = "b";
        String b = "a" + bb;
        System.out.println((a == b)); //result = false
这个好理解,"a" + bb中的bb是变量,不能进行优化。
(6)     再修改一下,把bb作为常量变量:
        String a = "ab";
        final String bb = "b";
        String b = "a" + bb;
        System.out.println((a == b)); //result = true
竟然又是true,编译器的优化好厉害啊!
(7)     考虑下面这种情况:
privatestatic String getBB()
{
    return"b";
}
 
publicstaticvoid main(String[] args)
{
    String a = "ab";
    final String bb = getBB();
    String b = "a" + bb;
    System.out.println((a == b)); //result = false
}
看来java(包括编译器和jvm)对String的优化,真的是到了极点了,String这个所谓的"对象",完全不可以看成一般的对象,javaString的处理近乎于基本类型,最大限度的优化了几乎能优化的地方。
4.3 String串接(Concatenation)。
滥用String的串接操作符是会影响程序的性能的。归根结底就是String类的非可变性。既然String对象都是非可变的,但是串接操作明显是要增长字符串的,也就是要改变String的内部状态,两者出现了矛盾。所以要维护String的非可变性,只好在串接完成后新建一个String 对象来表示新产生的字符串了。也就是说,每一次执行串接操作都会导致新对象的产生,如果串接操作执行很频繁,就会导致大量对象的创建,性能问题也就随之而来了。
为了解决这个问题,JDK为String类提供了一个可变的配套类,StringBuffer。
使用StringBuffer对象,由于该类是可变的,串接时仅仅时改变了内部数据结构,而不会创建新的对象,因此性能上有很大的提高。
针对单线程,JDK5.0还提供了StringBuilder类,在单线程环境下,由于不用考虑同步问题,使用该类使性能得到进一步的提高。
4.4 String的长度
查看String的源代码我们可以得知类String中是使用int域 count 来记录对象字符的数量,因此,我们可以推测最长的长度为 2^32,也就是4G。
不过,我们在编写源代码的时候,如果使用 Sting str = "aaaa";的形式定义一个字符串,那么双引号里面的ASCII字符最多只能有 65534 个。原因是在class文件的规范中, CONSTANT_Utf8_info表中使用一个16位的无符号整数记录字符串的长度的,最多能表示 65536个字节,java class 文件是使用一种变体UTF-8格式来存放字符的,null值使用两个字节来表示,因此只剩下 65536- 2 = 65534个字节。也正是变体UTF-8的原因,如果字符串中含有中文等非ASCII字符,那么双引号中字符的数量会更少(一个中文字符占用三个字节)。如果超出这个数量,在编译的时候编译器会报错。
4.5 String参数传递问题
publicclass StringTest
{
    staticvoid func(String s)
    {
        s += "tail";
    }
 
    staticvoid test()
    {
        String a = "abc";
        func(a);
        System.out.println(a);
    }
 
    publicstaticvoid main(String[] args)
    {
        test();
    }
}
程序运行结果:
abc
 
分享到:
评论

相关推荐

    神奇的PHP String(深入剖析)

    对PHP String的深入了解与研究。

    STL 的string类怎么啦

    那时,我不得不研究那根本不是给人看的SGI出品的string类的源码,代码的可读性几乎为零,而且随着了解越深入,就越觉得C++的世界中到处都是陷阱和缺陷。越来越觉得有时候那些类并不像自己所想象

    android 多语言

    2011年03月01日 星期二 23:29 我们建好一个android 的项目后,默认的res下面 有layout、values、drawable等目录 这些都是程序默认的资源文件目录,...这里只是简单的介绍了一下多语言对应,剩下的大家自己深入研究吧!

    深入研究:探索前端之谜前端探秘

    mark: :heavy_check_mark:isNumber :heavy_check_mark: isString :heavy_check_mark: isBoolean :heavy_check_mark: isObject :heavy_check_mark: isObjectLike :heavy_check_mark: isPlainObject :heavy_check_mark...

    基于PII分析法的煤矿瓦斯事故分析研究

    为了深入分析煤矿事故发生的原因,探求煤矿事故发生机理,预防煤矿事故的发生,保障广大煤矿职工的人身安全,通过介绍PII分析法,研究了PII分析法在煤矿事故致因分析中的可行性、必要性,以实际瓦斯事故案例,应用PII分析法...

    C语言字符串处理库函数实现

    资料比较全地整理了string.h中常见的字符串处理函数,对每个函数完整地实现并有简要的注释。如果你喜欢深入研究C编译器技术,本资料值得你拥有。

    C#基础:基于const与readonly的深入研究

    •readonly和const都是用来标识常量的[1]。•const可用于修饰class的field或者一个局部变量(local variable);而readonly仅仅用于修饰class的field。•const常量的值必定在编译时就已明确并且恒定的;...

    C/C++中指针和引用之相关问题深入研究

    一、基本知识指针和引用的声明方式:声明指针: char* pc;声明引用: char c = ‘A’ char& rc = c; 它们的区别:①从现象上看,指针在运行时可以改变其所指向的值,而引用一旦和某个对象绑定后就不再改变。...

    一个java正则表达式工具类源代码.zip(内含Regexp.java文件)

    这个工具类目前主要有25种正规表达式(有些不常用,但那时才仔细深入的研究了一下正规,写上瘾了,就当时能想到的都写了): 1.匹配图象; 2 匹配email地址; 3 匹配匹配并提取url ; 4 匹配并提取http ; 5.匹配日期 6...

    深入搜索引擎--海量信息的压缩、索引和查询

    《深入搜索引擎:海量信息的压缩、索引和查询》作为斯坦福大学信息检索课程的教材之一,具有一定的阅读难度,主要面向信息检索专业高年级本科生和研究生、搜索引擎业界的专业技术人员和从事海量数据处理相关专业的...

    DynoBind:使用 C# 简化后期绑定调用

    # 简介 使用 DynoBind,您可以使用以更简单的方式进行后期绑定调用,而不是深入研究 .NET 功能强大但复杂的反射系统。 使用示例 让我们用一个例子来试试。 假设我们有一个CExecutionManager类,它公开了一个名为...

    深入理解JavaScript和TypeScript中的class

    最近在学习 Angular 的过程中发现其大量的运用了 class,不得不佩服,Angular 确实是一个优秀的、值得深入研究的 框架。 本文将简单的介绍一下 JavaScript 和 TypeScript 中的 class。 基本概念 在介绍 class 之前,...

    delphi超级实例偏hacker

    突破验证码限制.txt 控制台输出\'颜色\'字.txt 整理的 Aphex 代码集.htm<br>文件夹防删除.txt 最小化Delphi内核.txt 来自 ly_liuyang 的三个代码.txt 深入了解String.txt 用Delphi创建NT2000账号....

    C# qq自动登录 09版本以前适用 源码

    这里我把源码一并给出,这也是我第一个C#上手程序,虽然只用了短短几个小时,但是我已经可以体会到C#强大的功能,今后还会继续深入研究! ps:程序基本完成了自动登录的全过程,但是没有完善保存列表的功能,这个也...

    memcached1

    上网baidu了很多东西,几乎都差不多,而且基于java的说的很少,所有只有在研究了各个其他语言类的应用后再来尝试在java上进行简单的操作应用。先从memcached上进行说明,memcached的最新版是采用c语言进行开发和...

    Java解惑(中文版)

    本书深入研究Java编程语言及其核心类为的细微之处,特写95个有关Java或其他类库的陷阱和缺陷的谜题,其中大多数谜题都采用短程序的形式给出。在每个谜题之后都有详细的解惑方案,这些方案在给出那些实际行为与表面上...

    graph.ql:更快更简单的创建GraphQL服务器的方法

    如果您有兴趣更深入地研究GraphQL,那么我创建了一个视频课程,即 。 特征 支持查询,变异和订阅 输入类型支持 可变支持 安装 npm install graph.ql 例子 var Schema = require ( 'graph.ql' ) // an object of ...

    正则匹配原理之 逆序环视深入 .

    说明:部分内容有待进一步研究和修正,因为最近工作太忙,暂时抽不出时间来,未研究过的可以跳过这一篇,想研究的不要被我的思路所左右了,有研究清楚的还请指正1 问题引出 前几天在CSDN论坛遇到这样一个问题: var ...

    C++程序设计彻底研究(是code不是书)

    本书包含所有重要的有关C++程序设计的知识,除了入门的基础知识之外,对较深入的内容也作了讲解,例如对VPTR和VTABLE都有精彩的说明。本书提供了极佳的学习步调和连贯的先后次序,叙述方式主线明显,使读者不会为...

    解读ASP.NET 5 & MVC6系列教程(5):Configuration配置信息管理

    在前面的章节中,我们知道新版的MVC程序抛弃了原来的web.config文件机制,取而代替的是config.json,今天我们就来深入研究一下配置文件的相关内容。 基本用法 新版的配置信息机制在Microsoft.Framework....

Global site tag (gtag.js) - Google Analytics