代碼膨脹(英語:Code bloat)是指程序代碼(可以是源代碼,也可以是機器代碼)生成的程序文件過大、運行緩慢或者有其他浪費資源的情況。代碼膨脹可能由編寫代碼的語言、編譯時所用的編譯器,或者編寫的程序員導致。代碼膨脹通常指源代碼過於冗長,由程序員的編碼習慣和編程語言的設計導致,代碼膨脹也可以指編譯後的代碼或者二進制文件占用空間過大(膨脹)。

常見原因

編輯

通常來說,膨脹的代碼是由於程序員使用了較多的代碼行,而非使用了解決問題的最佳方案。

程序員寫出膨脹代碼的部分原因有:

  • 過度設計
    • 過度使用面向對象(OOP)結構,如類和繼承。這可能導致麻煩且混亂的設計,使代碼量多於必要。
    • 不正確的使用設計模式——面向對象的開發人員可能在不需要使用設計模式的地方強行使用,從而導致問題。
  • 沒有用適當的封裝方案使代碼可重複利用,導致代碼重複[1]
  • 宣告式編程——在命令式或面向對象語言中實現宣告式編程風格通常會導致代碼膨脹。
  • 過度的循環展開——不理智的過度優化性能。
  • 過度使用多重If條件語句——而沒有使用如查找表

一些原生編譯器推導膨脹的例子包括:

  • 死代碼——代碼被編譯,但從未被使用。
  • 冗餘計算——重新計算已經計算過的表達式。這種冗餘計算經常在實現防止緩衝區溢出的「邊界檢查」代碼時產生。 尖端的編譯器只將其計算一次,使用常用子表達式消除英語Common subexpression elimination循環不變代碼外提技術消除冗餘計算。
  • C++中採用的模板系統的一些原生實現是編譯該語言的編譯器之不足之處的例子。實現此特性的原生編譯器可以為使用的每個資料類型引入一個模板類版本的方法。但是,這也導致被編譯的方法可能永遠不會被用到,導致代碼膨脹。更尖端的編譯器和鏈接器能檢測多餘的副本並將其丟棄,或者避免產生,從而減少膨脹。因而,使用能放棄死代碼英語Dead code的編譯器可以使模板代碼產生更小的二進制文件。[2]

例子

編輯

下列JavaScript程式碼算法有着大量的冗餘變量、不必要的邏輯,以及低效的字符串連接。

// Complex 
function TK2getImageHTML(size, zoom, sensor, markers) {
    var strFinalImage = "";
    var strHTMLStart = '<img src="';
    var strHTMLEnd = '" alt="The map"></div>';    
    var strURL = "http://maps.google.com/maps/api/staticmap?center=";
    var strSize = '&size='+ size;
    var strZoom = '&zoom='+ zoom;
    var strSensor = '&sensor='+ sensor;    
   
    strURL += markers[0].latitude;
    strURL += ",";
    strURL += markers[0].longitude;
    strURL += strSize;
    strURL += strZoom;
    strURL += strSensor;
    
    for (var i = 0; i < markers.length; i++) {
        strURL += markers[i].addMarker();
    }
    
    strFinalImage = strHTMLStart + strURL + strHTMLEnd;
    return strFinalImage;
};

而相同的邏輯可以用下列方式更有效地表達:

// Simplified 
function TK2getImageHTML(size, zoom, sensor, markers) {
    var url = [ 'http://maps.google.com/maps/api/staticmap',
        '?center=', markers[0].latitude, ',', markers[0].longitude,
        '&size=', size,
        '&zoom=', zoom,
        '&sensor=', sensor ]; 
    for (var i = 0; i < markers.length; i++) {
        url.push(markers[i].addMarker());
    }
    return '<img src="' + url.join('') + '" alt="The map" ></div>';
}

不同語言的代碼密度

編輯

各種計算機語言代碼密度有着很大差別,以「緊湊」語言(例如領域特定語言微軟P代碼英語Microsoft P-Code線程代碼英語Threaded code)編寫的程序以及緊湊語言(以機器代碼編寫)的直譯器通常比直接用機器語言編寫程序消耗更少的代碼量。

減少膨脹

編輯

減少代碼膨脹的一些技術包括:[3]

  • 重構經常使用的代碼序列為子程序,並從多個位置調用該子程序,而不是在各個位置上複製並粘貼英語Copy and paste programming這段代碼。
  • 重新使用已經被編寫的子程序(可能利用附加參數),而不是從頭編寫它們的新代碼。

參見

編輯

參考資料

編輯
  1. ^ 存档副本. [2017-06-12]. (原始內容存檔於2017-05-31). 
  2. ^ hopl-may.dvi (PDF). [2017-06-12]. (原始內容存檔 (PDF)於2007-11-20). 
  3. ^ Code bloat. DocForge. [30 December 2009]. (原始內容存檔於2016-03-05).