导言
互联网时代的到来以及无处不在的宽带互联网接入的出现,促使视频和其它格式媒体内容的互联网传送在2005年迅猛发展到空前的水平。老牌媒体公司以及行业新秀几乎每天都会发布新的内容服务、新的内容标题、现有标题的新格式、全新的商业模式和商业投机的行业新秀。后PC相关设备领域发展突飞猛进,囊括了电视游戏机、手机、DVR、新设备如视频iPod、甚至传统设备如普通电视。甚至基于图文的web也进入了真正的多媒体环境,流式音频和视频广告替代了文字页面上的静态网页广告,音乐和视频成为web目的地上内容的中心装饰,范围涉及广泛,从社会联网站点到体育站点到主流互联网门户。
在这种背景下,商用对等技术(P2P)的支持者最近宣布:P2P将成为现今数字媒体文件的一种重要传送机制。这正确吗?P2P的时机最终将会在2006年到来吗?
虽然互联网对等技术已经存在了近20年,但现代的P2P始于1999年Napster的产生,它是一个可下载的程序,允许用户通过互联网免费共享音乐和其它MP3文件。Napster具有中心目录服务的特点,将独立的P2P客户端彼此连接,在这之后,实际的文件传输在客户端之间直接进行,也就是从一个对等端到另一个对等端。在Napster被美国法院裁决为对音乐公司的版权负有“连带侵犯”责任之后,出现了更新版本的P2P软件。这些更新的程序,如Grokster、Morpheus、WinMX和eDonkey,去除了中心目录,而将目录服务连同文件传输功能一起分布到P2P客户端网络,目的在于消除侵犯版权的法律风险。在2005年末,这一策略同样受到美国法院的制裁,Grokster及同类程序被关闭了。
某些违法的P2P公司试图幸存下来,尝试将P2P重新定位为合法的媒体内容互联网分发的传送机制。这些公司加入了少数幸存的商业P2P供应商,声称P2P技术优于其它传送媒体文件的可选方案。这一主张在理论方面引起很大争议,因为在P2P技术上几乎不可能实现合法的、大规模的媒体传送系统的实施。这一主张有理由吗?或者它不过是厂家的夸大宣传?
在评估P2P是否有可能成为互联网媒体分发的一个可行方案时,必须回答五个关键问题:
1. P2P能完成任务吗? – 它比其它可用技术更快或者至少一样快吗?
2. P2P具有伸缩性吗?
3. P2P如何适应不断扩展的非PC设备世界?
4. 用户想要(或者至少他们愿意接受)商业P2P系统吗?
5. P2P将会幸存下来并长期兴旺呢?还是一时的产物?
当前的解决方案:CDN
互联网媒体分发当前最好的解决方案是一种称作内容传送网络(CDN)的内容传送体系结构。大多数主要的媒体公司利用CDN来解决在互联网上传送媒体内容所固有的问题:性能、可伸缩性和可靠性。性能是关键因素,因为伴随电视、高清电视以及CD音频成长起来的用户期待体验高品质的媒体产品,无法容忍不合理的品质损害。互联网“最佳努力”的体系结构所固有的拥塞以及连贯性的缺乏意味着,标准的互联网连接(如ISP所提供的连接)通常不能提供所需的传送性能。可伸缩性是很重要的,因为为所有内容(尤其是最流行的内容)捕捉每个可能的受众是非常关键的。不过,要正确地设计内容流行性以及受众的规模是很困难的,而且,维护备用容量来解决稀少但经常的受众高峰是非常昂贵的。可靠性也是重要因素之一,因为中断意味着暂时和永久地丢失受众,从而影响收入和利润。
通过将内容的传送从媒体供应商的网站基础设施卸载到CDN服务传送基础设施,CDN可解决这些问题。一般而言,CDN的基础设施由三个主要部分组成:
数千台服务器
在互联网不同地点全球分布
由管理软件链接在一起,该管理软件将:
决定在CDN内存储内容对象的频率和地点
选择最佳的服务器来执行每次媒体传送
管理、测量以及报告(通常是实时的)传送活动
在互联网不同点上分布的数千台服务器上预先部署内容对象,缩短了供应媒体对象的服务器和接收该媒体对象的客户端之间的网络距离。这显著减少了网络拥塞的性能抑制影响,就像居住在离工作更近的地方将会减少每天的上下班交通时间:更少的路程意味着交通引起的延迟更少。在综合考虑服务器可用性、服务器负载、网络流量状态、网络拥塞程度和交付目的地的情况下,通过智能化选择(管理软件所提供的功能)将要使用哪个网络、网络段、服务器和/或服务器地点,良好构建的CDN增大了这一效应。例如,良好构建的CDN可能会决定使用在地理上距离交付目的地更远的一台服务器,因为该服务器可以利用性能更佳(与地理上更近的另一台服务器相比)的网络以到达目的地。
不过,CDN所部署的数千台服务器不仅仅使传送快速,它们还使总的传送容量极具伸缩性。当给定的内容对象或标题变得流行起来时,CDN可以使用所需的服务器台数以满足传送要求。一个良好构建的CDN会自动做出这种资源调度决定(管理软件的另一个功能),因此,当对对象的需求增加时,会平稳地伸缩,没有延迟,无论需求曲线如何垂直(“急剧上升”)。
最后,但同样重要的是,CDN所部署的数千台服务器提供(根据设计)几乎无限级的冗余,因此可靠性非常高。如果某台CDN服务器发生故障,管理软件只需选择其它服务器来执行本应由该服务器完成的媒体交付。如果CDN服务器所在的整个地点由于设备电源问题、城市区域电源问题、自然灾害或任何其它原因发生了故障,CDN基础设施的全球分布性质意味着:仍然有数千台未受影响的服务器可用于执行内容交付。
因此,一个良好构建的CDN可以比网站的原始服务器更快、更连贯地传送内容,尤其是媒体内容典型的大对象,而且在本质上没有停机时间。这样就形成了一个比传统传送媒体体验更令人满意的互联网传送媒体体验:内容本身在属性方面是高品质的,如屏幕大小、帧频、音频保真度等,而不是受到损害的品质;媒体播放立即开始,连续不断(也就是,一旦开始播放,就没有很长的开始延迟,也没有停止/开始/跳过);流行的内容每次都被传送,不会导致淹没、性能差、服务器崩溃,无论受众多么快速地聚集(周、小时或秒);任何时候只要用户请求,内容都始终可用,不存在停机或中断。
商业P2P:体系结构和假设
商业P2P意图通过将内容交付从媒体供应商的网站卸载到商业P2P系统上来解决互联网媒体传送的问题。一般来说,一个商业P2P系统将包括:
P2P客户端软件
由最终用户下载并安装在其PC上
作为一个单供应商模块(通常被嵌入单供应商客户应用中如品牌的单用途媒体播放器),或作为一个可由多个媒体供应商共享的独立模块
部署在全世界数千或数百万台PC上
存储内容对象以便分发给其它P2P客户端
至少某个程度的集中控制,可能集中管理和报告
P2P的本质理念很简单:通过P2P客户端程序,用户下载并存储内容对象,然后这些内容对象就可以向其它用户提供服务。服务功能使用用户的PC资源和互联网连接,而不是集中的服务器和互联网连接。在理论上,这种基础结构将解决互联网媒体传送的问题:内容对象可以从较近的位置交付(因为用户PC分散在整个互联网上),避免了网络拥塞,获得高速度;内容对象可从许多用户PC交付,从而获得了规模;内容对象将至少在一些用户PC上始终可用,从而获得了可靠性。然而,在实践中P2P的成功取决于满足几个固有的假设。
首先,很显然,如果没有合理广泛分布的P2P客户端部署,P2P系统就无法成功,因为根据定义,广泛分布的P2P客户端是供应内容对象的基础设施。这样就出现了好几个问题。某个P2P客户端被用户广泛采纳看起来不太可能,除非通过该客户端有大量的内容可提供;另一方面,媒体公司选择利用某个缺少预先广泛采纳的P2P客户端也不太可能。新的用户技术常常由于这类“鸡和蛋”的问题而失败。解决这个问题的方法之一是,媒体公司要求下载某个P2P客户端作为第一次媒体交付的条件;不过,这带来了抑制许多用户完成第一次购买这一重大风险(在互联网电子商务的其它方面也观察到了类似的现象,“被抛弃的购物车”会是一个主要成本以及成功的重大障碍)。这也提出了一个问题:给定的用户将同意下载多少个全异的P2P客户端(在本文的其它地方处理;但是在这种背景下,可能会成为一个强制因素,尤其是随着互联网媒体产业的成熟)。这一问题的另一个解决方法是,P2P客户端被嵌入到其它软件中,如操作系统或浏览器,或者预载在系统上。不过,这些预先安装的情景提出了这样附属的问题:自动激活是否为可持续的战略(在当今垃圾邮件、间谍软件以及强烈的用户隐私主义的时代,或许不是);如果不是,这类预载软件的激活率(或许很低);什么组织将作为中央权力机构来经营这样一个多供应商网络;如何确保用户PC的安全;对于暂时存储在其PC上的什么内容,用户将具有什么级别的控制;在实践中用户将如何使用这些控制。
违法的P2P轻松地克服了这些问题,主要是由于免费(非法下载的)音乐和其它内容的吸引。但有趣的是,即使存在令人兴奋的免费媒体内容的引诱,大多数违法的P2P系统直到更早的P2P版本被关闭才得到广泛普及,;大多数用户在任何时间点上只安装和使用一个或最多两个违法的P2P系统;在这些违法的P2P网络上安全(由于垃圾邮件、病毒和间谍软件的缘故)迅速成为一个主要问题,只是由于大量免费(非法的)内容,用户才在很大程度上容忍这个问题。证据表明,在违法的情形外,P2P在建立创建有意义的媒体交付基础设施所必需的覆盖区中将面临重大的障碍。
第二,假定已经取得了充分分布的P2P客户端部署,任何成功的给定内容对象的P2P交付要求在P2P客户端群体中适度分布该对象的存储。由于总的P2P客户端部署代表可用的最大交付基础设施,实际存储内容对象的总P2P网络的子集代表真正的交付覆盖区。在谈及“普及性悖论”时,商业P2P公司承认:内容普及性给传统的站点基础设施带来了压力(并且可能击垮);相反,普及性提高了商业P2P系统的交付性能。这个所谓悖论的原因很简单:一个对象越流行,它被存储在P2P网络中的地点就越多,因此,随后供应该对象的地点将越多。不过,反过来也是对的:对于不流行的内容,商业P2P系统运行的效果将有限。
在实践中,这成为了统计中的一个运用:
在整个互联网安装的P2P客户端的数量是可用于执行给定交付的理论最大值;存储对象的P2P客户端的数量(在其总数中)代表了可以传送该对象的实际最大值。这两个数字越小,可以供应该对象的位置的数量就越少。
P2P网络松散管理本质的后果进一步减少了该数字:在任何给定时刻都无法获得的、安装了P2P的系统的百分比。每个用户控制自己的计算机。他们经常关闭计算机或断开网罗连接(例如,将便携电脑带上路);他们常常将计算机用于完成其它计算任务,其中许多任务使用大量的系统可用资源;他们常常使用计算机进行其它通信任务,其中许多任务(如下载媒体内容)占用全部或大部分带宽。P2P网络不能预先腾空客户端P2P系统的这些其它用途,也不能负面影响用户每天对其计算机的使用(如果影响的话,用户将会卸载它)。因此,存储有对象的可用P2P客户端的数量被减少为开机的、在线的、系统和连接资源可用于P2P交付的客户端的子集。
然后,这个数字再次被另一个非常重要的考虑因素所减少:正在使用系统和接入连接进行其它P2P对象交付的、安装了P2P的客户端的百分比。如同在大多数其它人类活动中一样,少数人将引起大多数举动——所谓的“超级用户”,在P2P网络中将存储大量对象。因为他们拥有总对象很大的百分比,这些少数的超级用户将成为在大多数时候传送多个对象的候选者,因此,常常将是连接点,从而不能传送某一个对象。逃离法律的P2P网络的任何用户都可以确认:除了最受欢迎的对象之外,通常是超级用户拥有一个所需的对象,在有机会下载这些不常见的对象之前,通常必须在超级用户的传送队列中等待很长时间,有时受其它因素干涉,如超级用户的PC关机了。
第三,成功的P2P网络将是那些通过数量克服大多数用户宽带接入技术的不对称本质的网络。电缆互联网接入和用户DSL是高度不对称的,所提供的下载速度比上传速度快10到20倍。在P2P网络中,高速下载的来源是其它P2P客户端,只能以较低的上传速度推出内容;因此为了在其容量有意义的部分填充一个下载管道,每个单独的下载都需要提供服务的客户端的一个多对一的比率。因此,以上所述的P2P统计活动是在单个好的交付候选者不能充分满足每个交付请求而每个请求需要5个或10个或更多好的交付候选者的环境中进行的。
第四,成功的P2P应用往往是那些交付用户永久存储的对象的应用,也就是用户保存很长时期的内容(通常,是因为他们打算重复访问该内容)。随着时间推移,存储增加了对象在存储中的P2P客户端的数量,而快速删除——例如,在单个收听/观看之后——抑制了P2P网络中存储的总拷贝的增加率,最终引起所存储的拷贝数量迅速下降。到目前为止,非法的音乐共享已经成为违法的P2P的“杀手应用”(2005年10月,音乐占有违法的P2P网络上内容对象的70%以上)。音乐是一种特殊的内容类型,用户几乎总是永久存储该类型——实际上,不仅永久存储,而且在录制格式改变时重复购买。另外,因为非法下载的音乐是“免费的”,任何人都可以成为一个超级用户,只需要窃取一些音乐,因此,很可能违法的P2P网络从永久存储大量音乐的超级用户增加的数量中不成比例地获益。不过,并非所有内容类型都像音乐一样被永久存储,看来不可能任何合法的内容类型都将产生盗窃的音乐所产生的超级用户的数量。而且,内容对象越大,用户可以在线存储的标题就越少。在当今200GB硬盘的背景下,3MB到10MB的歌曲文件是小文件,但是2GB到10GB的视频文件就不是小文件了。
注意,为了使用户永久地存储内容(这有益于寻求使用那些存储的对象进行随后交付的P2P网络),用户必须获得一些好处,这也很重要。通常,这种好处将是该用户可以重复地体验该内容对象。在通知或不通知用户的情况下,让P2P网络将对象“推”到P2P客户端,这是不切实际的,因为P2P网络希望这些对象被更广泛地分布。同样,对象在P2P客户端上不可见地持续存在是不切实际的,也就是,在用户相信对象已经被删除之后该对象持续存在。试图将未请求的对象推到P2P客户端或者保持不需要的对象,将会非常危险地靠近侵入、间谍软件以及引起用户愤怒并使令人厌恶的公司的名声变坏的其它行动。
倘若有这些固有的假设,商业P2P将会成功成为CDN可行的互联网媒体传送的替代方案吗?该问题的答案在这五个关键问题的答案之中。(未完待续)
