第21次互联网报告
第21次互联网报告
第21次互联网报告调查背景
中国网民人数与结构特征、
第21次互联网报告调查方法
依据统计学理论和国际惯例,在前20次调查工作基础之上,本次调查采用了网下抽样、网上联机、网上自动搜索和统计
电话抽样调查侧重于了解中国网民数量与结构特征、上网条件、网络应用、网民观点和非网民状况。目标总体细分如下:
子总体B:住校的高等院校学生
子总体C:没有住宅电话的居民,再细分为:
子总体C1:有小灵通(无线市话)的居民
子总体C3:无任何移动电话的居民
小灵通属于无线市话,接听免费,从访问实施的角度看,住宅固话与小灵通在局号上无法区分,合并两者。即子总体A和子总体C1可以合为一个子总体访问。从访问实施的角度看,可以划分如下:
q子总体A+C1:有住宅固定电话(含小灵通)的居民
q子总体B:住校的高等院校学生
q子总体C2:无住宅固定电话,有手机的居民
q子总体C3:无住宅固定电话、无手机的居民
此次只针对子总体A+C1、B、C2进行调研,抽样样本总数为46,300个。不对子总体C3调研的原因在于,子总体C3中的网民规模较小,考虑到随着社会经济的发展,此部分人群会越来越少,忽略不访问。
1.子总体A+C1抽样方法
◇抽样方法
电话调查的抽样方法是分层二阶段抽样,目的是使所抽取的样本近似接近自加权样本。考虑到第21次调查的结果不仅要估计全国的情况,还要估计各省的情况,所以先按省分层,在各个层中独立抽取样本,然后再在省内各地市分配样本。
◇抽样指标
◇样本量
各省样本量根据第19次调查各省网民人数的平方根占各省网民数平方根之和的比例进行分配,不足600个样本的省份补足到600个。综合考虑精度与成本,最终样本确定为31,802个。
◇实施方式
◇加权方式
利用家庭成员的性别、年龄和学历等基本情况对样本总体进行相应加权调整,减少接电话的家庭成员不随机对样本造成的偏差。
◇抽样调查成功率
按美国舆论研究协会(AAPOR)成功率公式三计算,本次抽样调查成功率为36.5%。
2.子总体B抽样方法
◇抽样方法和样本量
◇抽样指标
理想的抽样指标应该是住校的学生人数,由于抽样框的限制,实际采用的抽样指标是在校学生人数。
◇实施方式
根据抽中学校的固定电话局号生成电话号码,随机排列之后进行拨打,对其中的宿舍电话进行访问。考虑到同宿舍的人同质性较高,采取方便原则,接电话的学生即为被访者。
3.子总体C2抽样方法
◇抽样方法和样本量
子总体C2指无住宅市话,有手机的6岁及以上居民。为保证调查的实施,同时综合考虑成本与精度,样本量在各省的分配按照各省移动电话的卡数占全国的比例分配,样本量不足150个的省份补足到150个。总体C2样本量为10,498个。
◇抽样指标
理想的抽样指标应该是“无住宅市话的实际手机用户数”,但是没有这个指标的详细数据。实际抽样指标是信息产业部公布的各省手机用户卡数。
◇实施方式
根据手机号段随机生成手机号码,拨打甄别出属于子总体C2的被访者,直到完成所要求的子总体C2样本量。
1.IP地址总数
IP地址分省统计的数据来自亚太互联网信息中心(APNIC)和中国互联网络信息中心IP地址数据库。将两个数据库中已经注册且可以判明地址所属省份的数据,按省分别相加得到分省数据。由于地址分配使用是动态过程,所统计数据仅供参考。同时,IP地址的国家主管部门信息产业部也会要求中国IP地址分配单位(如中国电信、中国网通等)每半年上报一次其拥有的IP地址数。为确保IP数据准确,中国互联网络信息中心(CNNIC)会将来自APNIC的统计数据与这些上报数据进行比较、核实,确定最终的IP地址数。
2.中国域名总数和网站总数
以下两部分数据相加,即可得到中国的网站和域名总数、分类数与地域分布等数据。
第一部分是.CN下的域名数和网站数,由中国互联网络信息中心(CNNIC)采用计算机网上自动搜索得到;第二部分是中国类别顶级域名与网站数,由国内各类别顶级域名注册单位协助提供。这些数据包括:所有类别顶级域名(gTLD)和域名下已开通的网站数;按.COM、.NET、.ORG分类的类别顶级域名(gTLD)和网站数;按注册单位所在省份分类的类别顶级域名(gTLD)和网站数。
采用计算机网上自动搜索,对抽取的网站从其首页(WWW+域名)开始搜索,通过网页上的层层链接,抓取所有属于该网站的网页特征及其文本内容。将由网页搜索所获得的所有中国网站的网页数和网页字节数分别相加,得到中国网页总数及网页字节数。该总数不含内容相同的重复网页。
4.网络国际出口带宽数
信息产业部通过电信企业的报表制度,定期得到中国各运营商与其他国家和地区相连的网络出口带宽总数。《中国互联网络发展状况统计报告》中纳入了这些上报数据。
第21次互联网报告术语界定
网民
手机网民
指半年内曾经通过手机接入互联网的网民,但不限于仅通过手机接入互联网的网民。
农村网民
指目前居住在农村的网民。
指在居民家庭中连入互联网的计算机,包括台式机和笔记本电脑。
IP地址
IP地址的作用是标识上网计算机、服务器或者网络中的其他设备,是互联网中的基础资源,只有获得IP地址(无论以何种形式存在),才能和互联网相连。
域名
是指以域名本身或者“WWW.+域名”为网址的web站点,其中包括中国的国家顶级域名.CN和类别顶级域名(gTLD)下的web站点。如:对域名cnnic.cn来说,它的网站只有一个,其对应的网址为cnnic.cn或www.cnnic.cn,除此以外,whois.cnnic.cn,mail.cnnic.cn……等以该域名为后缀的网址只被视为该网站的不同频道。
动态网页
指URL中含“?”或输入参数的网页,包括ASP、PHP、PERL、CGI等在Server方进行处理的网页。
网页的更新周期
指网页的最后更新日期与搜索网页时的时间差。
调查范围
调查数据截止日期
本次调查统计数据截止日期为2007年12月31日。
第21次互联网报告网民规模与结构特征
本章摘要
截至2007年12月,网民数已达到2.1亿人。中国网民数增长迅速,2007年一年增加了7300万,年增长率为53.3%。
目前中国16%的互联网普及率仍比全球平均水平19.1%低3.1个百分点。
从接入方式上看,宽带网民数达到1.63亿人,手机网民数达到5040万人,这两种接入方式发展较快。
从地域上看,北京和上海的互联网普及率较高,已经分别达到46.6%和45.8%。增长量上,广东由于手机网民数增长的拉动,增长人数最多,一年内共增加了1500万网民。
第21次互联网报告总体网民规模
截至2007年12月,网民数已增至2.1亿人。中国网民数增长迅速,比2007年6月增加4800万人,2007年一年则增加了7300万人,年增长率达到53.3%。,在过去一年中平均每天增加网民20万人。目前中国的网民人数略低于美国的2.15亿[ 美国网民数据来源:www.internetworldstats.com],位于世界第二位。
网民购置上网设备和上网都需要一定的经济支持,中国居民的消费水平偏低,因此经济因素一直是制约互联网普及的重要因素之一,历次对非网民不上网的原因调查结果也印证了这一点。近几年经济的高速增长促进了互联网的迅猛发展,中国2004~2006年的年均GDP增长率均在10%[ 数据来源:《2007中国统计年鉴》]以上,中国经济一直在高位运行,加之同期政府鼓励“减缓投资、启动消费”,居民的收入水平及消费水平日趋改善,越来越多的居民开始使用互联网。
快速增长的农村网民构成了新增网民的重要组成部分。2007年农村网民规模年增长率超过100%,达到127.7%,农村网民数量达到5262万人。7300万新增网民中的4成,即有2917万来自农村。
互联网娱乐概念正日渐深入人心,越来越多的居民感受到互联网娱乐功能的强大,网络音乐和即时通信成为网民使用率排名前两位的网络应用,大量学历较低的网民被互联网的娱乐休闲功能吸引而涌入互联网。
图2.1 中国网民人数增长情况
根据美国墨西哥大学教授罗杰斯的创新扩散理论,新事物的发展通常呈现S形,当普及率在10%~20%之间时,扩散过程会加快,直至达到一定数量之后才会慢下来[ 《创新的扩散》,Everett M. Rogers,中央编译出版社,2002年6月。]。2006年12月中国互联网普及率是10.5%,2007年12月中国互联网普及率增至16%,中国正处于网民快速增长的阶段。
美国和韩国的互联网网民普及率的增长趋势符合创新扩散理论,当其互联网普及率在10%以上时,互联网规模及普及率迅速增长。美国1998年的互联网普及率是18.6%,1999年即快速增长到26.2%[ 美国商务部数据,2002年。];韩国1999年的互联网普及率是22.4%,2000年则跃升至33%,网民规模从943万快速增加至1393