希望到2030年,中國的網絡研究者,CERNET的工作者,也能取得世界領先的成果,自豪地說出這句“我們做到了”!
——李星
李星 CERNET網絡中心副主任、清華大學教授
互聯網技術進化:IPv6將成為新熱點
誰更偉大?科學家還是工程師?
對很多領域來說,科學家發現了自然界的規律,而工程師在理解它之后,再依據規律去實現各種工程。這樣看來,科學家的角色更重要。
但也有一個例外,那就是互聯網。因為TCP/IP網絡協議是工程師設計的,相當于創造了一個新的定律。實際上,無論是牛頓還是愛因斯坦,科學家們把物理空間中存在的某種規律發現出來,但真正規律的締造者其實是自然界。而與物理世界相對應,網絡則全然不同。在網絡的世界中,工程師充當了“自然界”的角色。
但比起自然界,工程師創造互聯網似乎更難,因為工程師是人,而人對問題的理解力總是有限的。
互聯網是沒有“設計藍圖”的,從誕生之日起,就在一步一步演進,擁有“設計原則”和“技術組件”這兩個屬性。
設計原則
互聯網的本質是無中心的分布式系統,可以說,這是互聯網“以不變應萬變”的設計原則。
1964年,美國的保羅·巴蘭(Paul Baran)提出分組交換概念,其核心就是分布式無中心的拓撲結構。
1972年,法國的路易·普贊(Louis Pouzin)提出Cyclades網絡結構。他認為,用戶終端不應該相信網絡是可靠的,因此網絡可以不完美(也不可能做到完美),由此產生了互聯網的主要設計原理:盡力而為,端到端。
1978年,溫頓·瑟夫(Vint Cerf)等互聯網先驅將原始的互聯網傳輸控制協議(TCP)的功能分為兩個協議:TCP和IP,最終形成了著名的TCP/IP的沙漏模型。
圖1 TCP/IP 沙漏模型
具體來看,互聯網設計原則可以總結如下(詳見RFC1958):
1.網絡協議必須適應異種機之間的互聯;
2.依靠標準選擇某一個方法;
3.具有很好的擴展性;
4.找到性能、成本和所能實現的功能的平衡點;
5.保持簡單性;
6.模塊化;
7.不要等待找到完美的解決方案;
8.盡量避免選項和參數;
9.在發送時應嚴格,在接收時應寬容;
10.小心處理自己沒有請求而收到的分組;
11.避免循環依賴性;
12.對象應該能夠自我描述,必須使用由IANA授權所使用的編碼;
13.任何協議都應使用統一術語、注釋、比特和字節順序;
14.只有當實現了幾個能夠運行的程序后,Internet的協議才能成為標準。
技術組件
互聯網的“組成模塊”是指具體的技術。由于有了不變的設計原則,互聯網的組成模塊一步一步演進。如果以十年為一個周期,在互聯網的不同發展階段,有著不同的代表性技術熱點。
1970年代,最重要的技術是NCP;
1980年代,最重要的技術是TCP/IP;
1990年代,是DNS、BGP;
2000年代,WWW出現,最重要的技術則是HTTP;
2010年代,因受斯諾登事件影響,加密的HTTPS廣受關注;
現在是2021年,預計IPv6相關技術模式將成為2020年代,也就是下一個十年的熱點。
這其中最主要的原因,就是IPv6擁有豐富的地址資源。隨著互聯網的發展,IPv4的地址枯竭,很多應用受限于IPv4的地址數量。
根據美國科學基金會在2016年的一項預測與比較顯示:1980年代,每十人平均擁有一臺計算機;到2016年,每個人平均擁有十臺計算機,而到2051年,大約每個人平均將擁有一千臺計算機。
圖2 IPv6地址空間
如此大量的地址需求給了IPv6大顯身手的機會。而當前,我國正加緊推進IPv6規模部署的國家戰略,我們能否把握這個難得的機遇,掌握未來的網絡核心技術?
標準制定
信息技術的發展速度非常快,而互聯網發展卻相對穩定:IPv4形成于1983年,至今變化不大;BGP4確定于1993年,現在仍然在使用,沒有出現像BGP5等新版本。這就不像移動通訊領域的2G、3G、4G,到現在的5G,不斷更新迭代。這源于TCP/IP等互聯網協議的穩定性。在穩定的基礎上,才能不斷擴大規模,達到全球互聯互通。
互聯網的穩定發展基于互聯網標準的制定,標準制定大概遵循以下幾點原則:
1.開放參與。任何個人都可以向IETF提交標準草案(Draft)。標準決策過程中的多元參與增強了多利益相關方的合法性。例如,業界一直以來提倡的“open source(開放源碼)”正是遵循這一原則。
2.流程透明。從草案(Draft)到標準(RFC),全程記錄郵件收發并公開會議記錄。如果你要在互聯網上做點事,符合透明開放,就能經得起考驗。
3.公開發表。通過IETF網站向全社會免費發布RFC。流程透明、公開發表提供了公眾監督及問責的機會。
4.免費使用。標準制定者自愿放棄專利,免知識產權費。互操作性促進互聯網的創新和變革。從專有協議到提供了互操作性的開放的互聯網標準,是一場顯著的社會技術變革。
免費發布和免知識產權費的互聯網標準,提供了開放性和互操作性的傳統。正是這種始終如一的開放性規則,促進了互聯網軟硬件創新的飛速發展。
同時,互聯網標準制定的關鍵詞還有“開放”、“自下而上”、“技術自愿釆用”、“功能互操作性”、“全世界可達”等特性。
還有兩個關鍵詞非常值得一提,那就是:“能夠競爭的時候就盡量競爭”,“只有需要合作的時候才合作”。因為經過競爭打拼出的標準才具備生命力。
從互聯網發展的歷史看,真正的創新需要具備五個因素:“叛逆的思想”、“大的戰略背景”、“充足的經費”、“市場經濟的驅動”,以及“精英團隊”。
教育信息化網絡:要留足創新空間
架構設計
在《教育信息化中長期發展規劃(2021-2035年)》和《教育信息化“十四五”規劃》的編制過程中,我們總結出新一代教育信息基礎設施架構,其設計包含的元素有“兩個設施,三個平臺,兩個體系”。
圖3 新一代教育信息基礎設施架構
在最底層是以“TCP/IP”為基礎的網絡基礎設施,其上是以云服務為代表的數據服務設施,它們通過技術的整合和演進為上層平臺提供越來越強的通訊能力、計算能力和存儲能力。在支撐運行體系和綠色安全體系的賦能之下,全面支持科研平臺、教學平臺和創新平臺這三大應用平臺的建設和發展。
這三個平臺采用“網絡切片(專網)”的設計理念。專網的特性有:統一和分級管理的TCP/IP網絡,統一分配的IP地址,統一管理的域名,保證網內信息傳輸的服務質量,與公眾互聯網之間設立明確的管理邊界。
但專網并不封閉,用戶可通過專網接入公網,訪問到合適的網絡資源;同時,又可以擁有一個獨立于公網的“空間”,為利用網絡自主創新提供條件。
發展趨勢
網絡發展,特別是教育網絡信息化的發展,預計將呈現以下趨勢:
首先,專網和公網融合。疫情期間,大規模的“停課不停學”居家學習,讓我們更加深入思考教育專網的內涵。未來,教育專網應該是無處不在的,專網和公網的融合是大勢所趨。
網絡和數據融合。未來網絡基礎設施和數據服務設施之間的交互會加強。
現實和虛擬融合。當前的熱點“數字孿生”(DigitalTwin),就是以數字化方式,對某一物理實體進行虛擬仿真。
此外,教學和科研融合,科研和創新融合。這和教育信息基礎設施架構所提到的科研平臺、教學平臺和創新平臺相一致。
最后,還有科學和人文融合,歷史和未來融合,學校和社會融合,中國和世界融合等趨勢。盡管當前我國面臨著嚴峻復雜的國際變局,但考慮到“構建人類命運共同體”等政策方針,教育網絡的全球化發展仍然不可逆轉。
衡量指標
在疫情防控的實踐應用中,我們總結出新一代網絡基礎設施需要具備的三個特性:
1.“服務質量可測性”,包括實時應用支持、自動調度等;
2.“安全風險可控性”,既能合規,又能發展;
3.“應用演進可行性”,也就是要留足可演進、快速迭代的空間。
而新一代教育信息化中的網絡基礎設施有如下衡量指標:
1.優于公網的訪問質量,尤其是訪問科學數據庫、教育科研信息相關資源;
2.體現教育網的特殊性,擁有公網無法訪問的信息資源;
3.超高性能信息傳輸,包括高性能計算(High Performance Computing,HPC)等;
4.開放的創新環境,包括創新項目、教育專網(大學)、開源信息共享等,一定要給大學校園提供創新的空間。
教育信息化應用:遵循三個準則
教育信息化從某種意義上看,比做網絡還要難。供求不對稱可能是系統開發中最大的問題。
中國有一句老話,叫做“知難行易”,用戶常常對于信息系統的真實需求描述不清。用戶真正想要什么?系統的開發者能不能領會他的需求?
對信息系統開發制作,我的三準則是:歷史記錄、進化空間、學習曲線。每一個準則都需要回答一個拷問。
歷史記錄
10年,100年后,1000年,10000年……后的考古學怎么看現在?
在考古界和人類文明史中,有“缺失的鏈環(Missing Links)”這樣的描述。比如,鳥類,大家認為是從恐龍進化而來的,但很少找到化石。在這個進化過程里,發生過的環節消失了,不留痕跡。
人類進入計算機時代后,隨著存儲設備的升級,軟件的版本更新,很多歷史記錄無法再讀取或運行,“缺失的鏈環(Missing Links)”現象更加廣泛存在。這意味著可能目前所有互聯網上的內容都會變成“缺失的鏈環”,很難想象未來的考古學家面對這種情況會做出何種反應。
在學校的信息化中,這種情況也處處可見。比如學校的網頁,我們還能找到過去某個時刻的網頁情況嗎?可能很多學校都找不到了。做好教育信息化應用,一定要注重歷史記錄,要對得起歷史。
IETF的RFC、HTML、TeX、UNIX等都是較好的注重保存歷史記錄的信息系統設計案例。我們由此總結出應用系統的框架設計思想:簡化最常見的任務,讓不常見的任務不至于太麻煩。很多時候人們花了很多時間卻抓不住重點,因為他們想取悅所有人。但關鍵在于我們不可能取悅所有人,只能明確哪些人最重要;只為80%設計;給內容創建者最大的權利;默認設置智能化。
而如果信息系統的設計面臨矛盾的話,要遵循這樣的優先級:用戶第一,文檔的作者第二,程序員第三,標準第四,理論的完美性排在第五。無論何時,用戶的優先級是最高的。
真正好的信息系統一定是頂尖的人寫的。在一流大學,信息系統使用者是一流的學者和學生,如何為他們提供好用的信息系統?如何創造出用戶喜歡的產品?
答案有:從制造簡潔的產品入手;保證自己愿意使用;設置默認值,而不是限制用戶使用;無論何時,都要使用自己的軟件。
微信創始人張小龍說的一句話,我非常認同,他說:如果解決方案非常復雜,那一定是問題錯了。真正好的應用,解決方案一定是優雅簡單的。
進化空間
有沒有做與當前主流不符合的研究的空間?能不能在大家都不看好的時候就能專注一項研究?
以IPv6過渡技術實踐為例。2017年底,中共中央辦公廳、國務院辦公廳發布了《推進互聯網協議第六版(IPv6)規模部署行動計劃》,提出大規模部署IPv6的國家戰略。
但IPv6過渡技術實踐之路卻并非一帆風順。當年,純IPv6網絡、IPv4/IPv6翻譯的技術路線并未得到足夠認可,無論從IETF的技術建議還是各國政府的政策都是雙棧模式。
有意思的是2020年,美國管理和預算辦公室(OMB)發布了IPv6部署和使用指南。盡管指南比中國的IPv6規模部署行動計劃晚了不少,但它卻明確提出,雙棧模式未來將難以維護,要向純IPv6網絡遷移。現在回頭看,純IPv6是未來的必然趨勢。CERNET從一開始就頂著各種非議一直堅持純IPv6網絡的建設,這一步無疑是走對了。
這就說明了,互聯網技術發展的速度比任何政府能夠控制的都要快。這也同樣帶給我們啟示:一方面,做研究、做戰略要有超前的眼光;另一方面,要有自主創新的空間,能跟得上網絡技術發展的腳步。
學習曲線
需要重新學習另一種技巧,而不是新的知識和智慧嗎?
我們需要思考的是,在信息系統、軟件的迭代更新中,用戶為達到同樣的目的,是需要浪費時間學習另一種“技巧”,還是真的在學習新知識、新智慧?
圖4 人類文明金字塔
在代表人類文明的金字塔中,從下往上,依次是“數據”、“信息”、“知識”,最頂層是“智慧”。目前來說,教育信息化處理數據沒問題、處理信息也沒問題,但能否處理知識、智慧?還是一個問號。
掌握核心技術要重視基礎研究
目前,教育網的藍圖中有四張網:CERNET、CERNET2、FITI和教育專網。令人振奮的是,其中至少有三張網已經落實。除CERNET(IPv4)、CERNET2(IPv6)外,未來互聯網試驗設施FITI(Future Internet Testing Infrastructure)也可以稱為CERNET3,已進入建設階段。
與CERNET、CERNET2以學校為接入單位相比,FITI還有一個新特點,就是能延伸到實驗室,延伸到院系,延伸到教研組,更好地進行創新。另外,教育專網建設方案正處于審批流程中。
從互聯網技術和教育信息化的發展歷史來看,如何才能掌握互聯網核心技術,是一個經久不衰的話題。回顧CERNET的發展歷程,我們會明白這樣一個道理:要注重基礎研究,只有注重基礎研究才會產生偉大的想法;也只有基礎研究才能產生大師級的人物。希望CERNET,CERNET2,FITI(CERNET3)這三張網能創造這樣的環境,讓偉大的想法和偉大的人物誕生。
在CSNET舉辦的亞洲接入互聯網35周年紀念座談會上,有互聯網先驅指出:
TCP/IP和Unix在一開始都不是明顯的贏家;網絡的國際需求強勁,但費用、電路稀缺等因素障礙了相關進展;另外,由于美國政府的參與,將非美國機構連接到網絡需要政策審查,等等。
總之,將互聯網接入國際的過程非常不容易,但如今回顧歷史,他們卻可以自豪地說出“And yet——We did it!(我們做到了)”!
這也是我對中國互聯網研究的期盼,希望到2030年,中國的網絡研究者,CERNET的工作者,也能取得世界領先的成果,自豪地說出這句“我們做到了”!
本文根據李星教授的報告《歷史和未來:互聯網技術和教育信息化》整理。
整理、責編:項陽
特別聲明:本站注明稿件來源為其他媒體的文/圖等稿件均為轉載稿,本站轉載出于非商業性的教育和科研之目的,并不意味著贊同其觀點或證實其內容的真實性。如轉載稿涉及版權等問題,請作者在兩周內速來電或來函聯系。