摘要:動態鏈接庫技術實現和設計程序常用的技術,在Windows和Linux系統中都有動態庫的概念,采用動態庫可以有效的減少程序大小,節省空間,提高效率,增加程序的可擴展性,便於模塊化管理。但不同操作系統的動態庫由於格式 不同,在需要不同操作系統調用時需要進行動態庫程序移植。本文分析和比較了兩種操作系統動態庫技術,並給出了將Visual C++編制的動態庫移植到Linux上的方法和經驗。
1、引言
動態庫(Dynamic Link Library abbr,DLL)技術是程序設計中經常采用的技術。其目的減少程序的大小,節省空間,提高效率,具有很高的靈活性。采用動態庫技術對於升級軟件版本更加容易。與靜態庫(Static Link Library)不同,動態庫裡面的函數不是執行程序本身的一部分,而是根據執行需要按需載入,其執行代碼可以同時在多個程序內共享。
在Windows和Linux操作系統中,都可采用這種方式進行軟件設計,但他們的調用方式以及程序編制方式不盡相同。本文首先分析了在這兩種操作系統中通常采用的動態庫調用方法以及程序編制方式,然後分析比較了這兩種方式的不同之處,最後根據實際移植程序經驗,介紹了將VC++編制的Windows動態庫移植到Linux下的方法。
2、動態庫技術
2.1 Windows動態庫技術
動態鏈接庫是實現Windows應用程序共享資源、節省內存空間、提高使用效率的一個重要技術手段。常見的動態庫包含外部函數和資源,也有一些動態庫只包含資源,如Windows字體資源文件,稱之為資源動態鏈接庫。通常動態庫以.dll,.drv、.fon等作為後綴。相應的windows靜態庫通常以.lib結尾,Windows自己就將一些主要的系統功能以動態庫模塊的形式實現。
Windows動態庫在運行時被系統加載到進程的虛擬空間中,使用從調用進程的虛擬地址空間分配的內存,成為調用進程的一部分。DLL也只能被該進程的線程所訪問。DLL的句柄可以被調用進程使用;調用進程的句柄可以被DLL使用。DLL模塊中包含各種導出函數,用於向外界提供服務。DLL可以有自己的數據段,但沒有自己的堆棧,使用與調用它的應用程序相同的堆棧模式;一個DLL在內存中只有一個實例;DLL實現了代碼封裝性;DLL的編制與具體的編程語言及編譯器無關,可以通過DLL來實現混合語言編程。DLL函數中的代碼所創建的任何對象(包括變量)都歸調用它的線程或進程所有。
根據調用方式的不同,對動態庫的調用可分為靜態調用方式和動態調用方式。
(1)靜態調用,也稱為隱式調用,由編譯系統完成對DLL的加載和應用程序結束時DLL卸載的編碼(Windows系統負責對DLL調用次數的計數),調用方式簡單,能夠滿足通常的要求。通常采用的調用方式是把產生動態連接庫時產生的.LIB文件加入到應用程序的工程中,想使用DLL中的函數時,只須在源文件中聲明一下。 LIB文件包含了每一個DLL導出函數的符號名和可選擇的標識號以及DLL文件名,不含有實際的代碼。Lib文件包含的信息進入到生成的應用程序中,被調用的DLL文件會在應用程序加載時同時加載在到內存中。
(2)動態調用,即顯式調用方式,是由編程者用API函數加載和卸載DLL來達到調用DLL的目的,比較復雜,但能更加有效地使用內存,是編制大型應用程序時的重要方式。在Windows系統中,與動態庫調用有關的函數包括:
①LoadLibrary(或MFC 的AfxLoadLibrary),裝載動態庫。
②GetProcAddress,獲取要引入的函數,將符號名或標識號轉換為DLL內部地址。
③FreeLibrary(或MFC的AfxFreeLibrary),釋放動態鏈接庫。
在windows中創建動態庫也非常方便和簡單。在Visual C++中,可以創建不用MFC而直接用C語言寫的DLL程序,也可以創建基於MFC類庫的DLL程序。每一個DLL必須有一個入口點,在VC++中,DllMain是一個缺省的入口函數。DllMain負責初始化(Initialization)和結束(Termination)工作。動態庫輸出函數也有兩種約定,分別是基於調用約定和名字修飾約定。DLL程序定義的函數分為內部函數和導出函數,動態庫導出的函數供其它程序模塊調用。通常可以有下面幾種方法導出函數:
①采用模塊定義文件的EXPORT部分指定要輸入的函數或者變量。
②使用MFC提供的修飾符號_declspec(dllexport)。
③以命令行方式,采用/EXPORT命令行輸出有關函數。
在windows動態庫中,有時需要編寫模塊定義文件(.DEF),它是用於描述DLL屬性的模塊語句組成的文本文件。
2.2 Linux共享對象技術
在Linux操作系統中,采用了很多共享對象技術(Shared Object),雖然它和Windows裡的動態庫相對應,但它並不稱為動態庫。相應的共享對象文件以.so作為後綴,為了方便,在本文中,對該概念不進行專門區分。Linux系統的/lib以及標准圖形界面的/usr/X11R6/lib等目錄裡面,就有許多以so結尾的共享對象。同樣,在Linux下,也有靜態函數庫這種調用方式,相應的後綴以.a結束。Linux采用該共享對象技術以方便程序間共享,節省程序占有空間,增加程序的可擴展性和靈活性。Linux還可以通過LD-PRELOAD變量讓開發人員可以使用自己的程序庫中的模塊來替換系統模塊。
同Windows系統一樣,在Linux中創建和使用動態庫是比較容易的事情,在編譯函數庫源程序時加上-shared選項即可,這樣所生成的執行程序就是動態鏈接庫。通常這樣的程序以so為後綴,在Linux動態庫程序設計過程中,通常流程是編寫用戶的接口文件,通常是.h文件,編寫實際的函數文件,以.c或.cpp為後綴,再編寫makefile文件。對於較小的動態庫程序可以不用如此,但這樣設計使程序更加合理。
編譯生成動態連接庫後,進而可以在程序中進行調用。在Linux中,可以采用多種調用方式,同Windows的系統目錄(..\system32等)一樣,可以將動態庫文件拷貝到/lib目錄或者在/lib目錄裡面建立符號連接,以便所有用戶使用。下面介紹Linux調用動態庫經常使用的函數,但在使用動態庫時,源程序必須包含dlfcn.h頭文件,該文件定義調用動態鏈接庫的函數的原型。
(1)_打開動態鏈接庫:dlopen,函數原型void *dlopen (const char *filename, int flag);
dlopen用於打開指定名字(filename)的動態鏈接庫,並返回操作句柄。
(2)取函數執行地址:dlsym,函數原型為: void *dlsym(void *handle, char *symbol);
dlsym根據動態鏈接庫操作句柄(handle)與符號(symbol),返回符號對應的函數的執行代碼地址。
(3)關閉動態鏈接庫:dlclose,函數原型為: int dlclose (void *handle);
dlclose用於關閉指定句柄的動態鏈接庫,只有當此動態鏈接庫的使用計數為0時,才會真正被系統卸載。
(4)動態庫錯誤函數:dlerror,函數原型為: const char *dlerror(void); 當動態鏈接庫操作函數執行失敗時,dlerror可以返回出錯信息,返回值為NULL時表示操作函數執行成功。
在取到函數執行地址後,就可以在動態庫的使用程序裡面根據動態庫提供的函數接口聲明調用動態庫裡面的函數。在編寫調用動態庫的程序的makefile文件時,需要加入編譯選項-rdynamic和-ldl。
除了采用這種方式編寫和調用動態庫之外,Linux操作系統也提供了一種更為方便的動態庫調用方式,也方便了其它程序調用,這種方式與Windows系統的隱式鏈接類似。其動態庫命名方式為“lib*.so.*”。在這個命名方式中,第一個*表示動態鏈接庫的庫名,第二個*通常表示該動態庫的版本號,也可以沒有版本號。在這種調用方式中,需要維護動態鏈接庫的配置文件/etc/ld.so.conf來讓動態鏈接庫為系統所使用,通常將動態鏈接庫所在目錄名追加到動態鏈接庫配置文件中。如具有X window窗口系統發行版該文件中都具有/usr/X11R6/lib,它指向X window窗口系統的動態鏈接庫所在目錄。為了使動態鏈接庫能為系統所共享,還需運行動態鏈接庫的管理命令./sbin/ldconfig。在編譯所引用的動態庫時,可以在gcc采用 –l或-L選項或直接引用所需的動態鏈接庫方式進行編譯。在Linux裡面,可以采用ldd命令來檢查程序依賴共享庫。
3、兩種系統動態庫比較分析
Windows和Linux采用動態鏈接庫技術目的是基本一致的,但由於操作系統的不同,他們在許多方面還是不盡相同,下面從以下幾個方面進行闡述。
(1)動態庫程序編寫,在Windows系統下的執行文件格式是PE格式,動態庫需要一個DllMain函數作為初始化的人口,通常在導出函數的聲明時需要有_declspec(dllexport)關鍵字。Linux下的gcc編譯的執行文件默認是ELF格式,不需要初始化入口,亦不需要到函數做特別聲明,編寫比較方便。
(2)動態庫編譯,在windows系統下面,有方便的調試編譯環境,通常不用自己去編寫makefile文件,但在linux下面,需要自己動手去編寫makefile文件,因此,必須掌握一定的makefile編寫技巧,另外,通常Linux編譯規則相對嚴格。
(3)動態庫調用方面,Windows和Linux對其下編制的動態庫都可以采用顯式調用或隱式調用,但具體的調用方式也不盡相同。
(4)動態庫輸出函數查看,在Windows中,有許多工具和軟件可以進行查看DLL中所輸出的函數,例如命令行方式的dumpbin以及VC++工具中的DEPENDS程序。在Linux系統中通常采用nm來查看輸出函數,也可以使用ldd查看程序隱式鏈接的共享對象文件。
(5)對操作系統的依賴,這兩種動態庫運行依賴於各自的操作系統,不能跨平台使用。因此,對於實現相同功能的動態庫,必須為兩種不同的操作系統提供不同的動態庫版本。
4、動態庫移植方法
如果要編制在兩個系統中都能使用的動態鏈接庫,通常會先選擇在Windows的VC++提供的調試環境中完成初始的開發,畢竟VC++提供的圖形化編輯和調試界面比vi和gcc方便許多。完成測試之後,再進行動態庫的程序移植。通常gcc默認的編譯規則比VC++默認的編譯規則嚴格,即使在VC++下面沒有任何警告錯誤的程序在gcc調試中也會出現許多警告錯誤,可以在gcc中采用-w選項關閉警告錯誤。
下面給出程序移植需要遵循的規則以及經驗。
(1)盡量不要改變原有動態庫頭文件的順序。通常在C/C++語言中,頭文件的順序有相當的關系。另外雖然C/C++語言區分大小寫,但在包含頭文件時,Linux必須與頭文件的大小寫相同,因為ext2文件系統對文件名是大小寫敏感,否則不能正確編譯,而在Windows下面,頭文件大小寫可以正確編譯。
(2)不同系統獨有的頭文件。在Windows系統中,通常會包括windows.h頭文件,如果調用底層的通信函數,則會包含winsock..h頭文件。因此在移植到Linux系統時,要注釋掉這些Windows系統獨有的頭文件以及一些windows系統的常量定義說明,增加Linux都底層通信的支持的頭文件等。
(3)數據類型。VC++具有許多獨有的數據類型,如__int16,__int32,TRUE,SOCKET等,gcc編譯器不支持它們。通常做法是需要將windows.h和basetypes.h中對這些數據進行定義的語句復制到一個頭文件中,再在Linux中包含這個頭文件。例如將套接字的類型為SOCKET改為int。
(4)關鍵字。VC++中具有許多標准C中所沒有采用的關鍵字,如BOOL,BYTE,DWORD,__asm等,通常在為了移植方便,盡量不使用它們,如果實在無法避免可以采用#ifdef 和#endif為LINUX和WINDOWS編寫兩個版本。
(5)函數原型的修改。通常如果采用標准的C/C++語言編寫的動態庫,基本上不用再重新編寫函數,但對於系統調用函數,由於兩種系統的區別,需要改變函數的調用方式等,如在Linux編制的網絡通信動態庫中,用close()函數代替windows操作系統下的closesocket()函數來關閉套接字。另外在Linux下沒有文件句柄,要打開文件可用open和fopen函數,具體這兩個函數的用法可參考文獻[2]。
(6)makefile的編寫。在windows下面通常由VC++編譯器來負責調試,但gcc需要自己動手編寫makefile文件,也可以參照VC++生成的makefile文件。對於動態庫移植,編譯動態庫時需要加入-shared選項。對於采用數學函數,如冪級數的程序,在調用動態庫是,需要加入-lm。
(7)其它一些需要注意的地方
①程序設計結構分析,對於移植它人編寫的動態庫程序,程序結構分析是必不可少的步驟,通常在動態庫程序中,不會包含界面等操作,所以相對容易一些。
②在Linux中,對文件或目錄的權限分為擁有者、群組、其它。所以在存取文件時,要注意對文件是讀還是寫操作,如果是對文件進行寫操作,要注意修改文件或目錄的權限,否則無法對文件進行寫。
③指針的使用,定義一個指針只給它分配四個字節的內存,如果要對指針所指向的變量賦值,必須用malloc函數為它分配內存或不把它定義為指針而定義為變量即可,這點在linux下面比windows編譯嚴格。同樣結構不能在函數中傳值,如果要在函數中進行結構傳值,必須把函數中的結構定義為結構指針。
④路徑標識符,在Linux下是“/”,在Windows下是“\”,注意windows和Linux的對動態庫搜索路徑的不同。
⑤編程和調試技巧方面。對不同的調試環境有不同的調試技巧,在這裡不多敘述。
5、結束語
本文系統分析了windows和Linux動態庫實現和使用方式,從程序編寫、編譯、調用以及對操作系統依賴等方面綜合分析比較了這兩種調用方式的不同之處,根據實際程序移植經驗,給出了將VC++編制的Windows動態庫移植到Linux下的方法以及需要注意的問題,同時並給出了程序示例片斷,實際在程序移植過程中,由於系統的設計等方面,可能移植起來需要注意的方面遠比上面復雜,本文通過總結歸納進而為不同操作系統程序移植提供了有意的經驗和技巧。