平台基礎知識, 2009-08-27 16:02:02
标簽 : 景濤 apk android Application package OPhone
一.引言
做過OPhone/Android應用開發的人,對apk檔案應該不會陌生。apk檔案,即Android application package檔案。每個要安裝到OPhone平台的應用都要被編譯打包為一個單獨的檔案,字尾名為.apk,其中包含了應用的二進制代碼、資源、配置檔案等。
本文将對apk檔案的結構和内容做一個簡單介紹,并以一個簡單的hello world程式為例,介紹一下apk檔案中二進制代碼dex檔案的反編譯過程。(作者:景濤)
二.Hello world示例
為了叙述友善,我們先給出一個簡單的hello world程式。工程的目錄結構如下:
view plain copy to clipboard print ?
- |-- AndroidManifest.xml
- |-- assets
- |-- bin
- |-- default.properties
- |-- res
- | |-- drawable
- | | `-- icon.png
- | |-- layout
- | | `-- main.xml
- | `-- values
- | `-- strings.xml
- `-- src
- `-- hello
- `-- world
- `-- hello.java
我使用的開發環境是eclipse及adt0.9和OPhone sdk 1.5。上圖中所有檔案和目錄都是根據建立工程時的配置自動生成的。hello.java是我在這個工程中唯一修改的地方,在程式執行時會在螢幕上顯示“hello, OPhone”的字樣。源碼如下,注意粗體為修改的代碼。
view plain copy to clipboard print ?
- package hello.world;
- import android.app.Activity;
- import android.os.Bundle;
- import android.widget.TextView;
- public class test extends Activity {
- @Override
- public void onCreate(Bundle savedInstanceState) {
- super.onCreate(savedInstanceState);
- TextView test = new TextView(this);
- Test.setText(“hello, OPhone”);
- setContentView(test);
- }
- }
使用eclipse編譯之後可以看到工程的目錄結構發生了變化。bin和gen目錄是編譯之後産生的。
view plain copy to clipboard print ?
- |-- AndroidManifest.xml
- |-- assets
- |-- bin
- | |-- classes.dex
- | |-- hello
- | | `-- world
- | | |-- R$attr.class
- | | |-- R$drawable.class
- | | |-- R$layout.class
- | | |-- R$string.class
- | | |-- R.class
- | | `-- hello.class
- | |-- helloworld.apk
- | `-- resources.ap_
- |-- default.properties
- |-- gen
- | `-- hello
- | `-- world
- | `-- R.java
- |-- res
- | |-- drawable
- | | `-- icon.png
- | |-- layout
- | | `-- main.xml
- | `-- values
- | `-- strings.xml
- `-- src
- `-- hello
- `-- world
- `-- hello.java
在gen目錄下生成了R.java檔案,這是系統根據資源檔案生成的。在bin目錄下生成了6個.class檔案,記住這一點。另外bin目錄下還生成了helloworld.apk,下面我們就來分析這個檔案。
三.Apk檔案結構
apk檔案實際是一個zip壓縮包,可以通過解壓縮工具解開。以下是我們用zip解開helloworld.apk檔案後看到的内容。可以看到其結構跟建立立的工程結構有些類似。
view plain copy to clipboard print ?
- |-- AndroidManifest.xml
- |-- META-INF
- | |-- CERT.RSA
- | |-- CERT.SF
- | `-- MANIFEST.MF
- |-- classes.dex
- |-- res
- | |-- drawable
- | | `-- icon.png
- | `-- layout
- | `-- main.xml
- `-- resources.arsc
3.1 Manifest檔案
AndroidManifest.xml是每個應用都必須定義和包含的,它描述了應用的名字、版本、權限、引用的庫檔案等等資訊[ , ],如要把apk上傳到Google Market上,也要對這個xml做一些配置。網上已有很多資料,在此就不多做介紹了。
在apk中的AndroidManifest.xml是經過壓縮的,可以通過AXMLPrinter2工具[ , ]解開,具體指令為:
view plain copy to clipboard print ?
- java -jar AXMLPrinter2.jar AndroidManifest.xml
3.2 META-INF目錄
META-INF目錄下存放的是簽名資訊,用來保證apk包的完整性和系統的安全。在eclipse編譯生成一個api包時,會對所有要打包的檔案做一個校驗計算,并把計算結果放在META-INF目錄下。而在OPhone平台上安裝apk包時,應用管理器會按照同樣的算法對包裡的檔案做校驗,如果校驗結果與META-INF下的内容不一緻,系統就不會安裝這個apk。這就保證了apk包裡的檔案不能被随意替換。比如拿到一個apk包後,如果想要替換裡面的一幅圖檔,一段代碼, 或一段版權資訊,想直接解壓縮、替換再重新打包,基本是不可能的。如此一來就給病毒感染和惡意修改增加了難度,有助于保護系 統的安全。
3.3 classes.dex檔案
classes.dex是java源碼編譯後生成的java位元組碼檔案。但由于Android使用的dalvik虛拟機與标準的java虛拟機是不相容的,dex檔案與class檔案相比,不論是檔案結構還是opcode都不一樣。目前常見的java反編譯工具都不能處理dex檔案。
Android模拟器中提供了一個dex檔案的反編譯工具,dexdump。用法為首先啟動Android模拟器,把要檢視的dex檔案用adb push上傳的模拟器中,然後通過adb shell登入,找到要檢視的dex檔案,執行dexdump xxx.dex。
仍然以hello world程式作為示範。
view plain copy to clipboard print ?
- # dexdump classes.dex
- Processing 'classes.dex'...
- Opened 'classes.dex', DEX version '035'
- Class #0 -
- Class descriptor : 'Lhello/world/R$attr;'
- …
- Class #5 -
- Class descriptor : 'Lhello/world/hello;'
- Access flags : 0x0001 (PUBLIC)
- Superclass : 'Landroid/app/Activity;'
- Interfaces -
- Static fields -
- Instance fields -
- Direct methods -
- #0 : (in Lhello/world/hello;)
- name : '<init>'
- type : '()V'
- access : 0x10001 (PUBLIC CONSTRUCTOR)
- code -
- registers : 1
- ins : 1
- outs : 1
- insns size : 4 16-bit code units
- catches : (none)
- positions :
- 0x0000 line=7
- locals :
- 0x0000 - 0x0004 reg=0 this Lhello/world/hello;
- Virtual methods -
- #0 : (in Lhello/world/hello;)
- name : 'onCreate'
- type : '(Landroid/os/Bundle;)V'
- access : 0x0001 (PUBLIC)
- code -
- registers : 4
- ins : 2
- outs : 2
- insns size : 17 16-bit code units
- catches : (none)
- positions :
- 0x0000 line=11
- 0x0003 line=13
- 0x0008 line=14
- 0x000d line=15
- 0x0010 line=16
- locals :
- 0x0008 - 0x0011 reg=0 test Landroid/widget/TextView;
- 0x0000 - 0x0011 reg=2 this Lhello/world/hello;
- 0x0000 - 0x0011 reg=3 savedInstanceState Landroid/os/Bundle;
- source_file_idx : 27 (hello.java)
Dexdump的結果可以看到有class0到class5六個class,跟工程目錄下bin目錄中的class數目相對應,可以想象dex檔案包含了所有的class檔案。但對hello.java的反編譯結果(Class #5)中很難發現我們做的修改,即如何輸出“hello, OPhone”。分支跳轉表的反編譯不完整,嚴格來說就沒有完整的dump出來。fill-array-data表也存在同樣的問題。還有其他很多限制。總的來說dexdump反編的結果可讀性很差。
目前在網上能找到的另一個dex檔案的反編譯工具是Dedexer。Dedexer可以讀取dex格式的檔案,生成一種類似于彙編語言的輸出。這種輸出與jasmin[ ]的輸出相似,但包含的是Dalvik的位元組碼。我們會在下一節詳細介紹一下Dedexer。
3.4 res目錄
res目錄存放資源檔案。關于apk檔案中的資源管理,OPhone SDN網站上已經有文章做過詳細介紹[ ],就不在此敷述。
3.5 resources.arsc
編譯後的二進制資源檔案。
四.反編譯工具Dedexer
Dedexer是目前在網上能找到的唯一一個反編譯dex檔案的開源工具[ ]。Dedexer下載下傳後需要編譯才能使用。如果你用過ant編譯java程式,那麼編譯Dedexer是一件非常簡單的工作。注意目前Dedexer的最新版本是1.5,隻能使用junit4.5編譯。下面以linux環境為例,講一下Dedexer的編譯使用過程。
下載下傳ddx1.5.zip後,解壓縮會産生一個dedexer目錄,其中包含build.xml檔案。我們需要根據本機的環境配置build.xml的内容,注意下面的粗體部分是我本機的配置。
view plain copy to clipboard print ?
- <!-- Directories of the project -->
- <property name="home" value="/home/danny/myproject/dedex/dedexer"/>
- <property name="junit-home" value="/home/danny/myproject/dedex"/>
- <!-- Directories derived from the source tree root -->
- <property name="classdir" value="${home}/classes"/>
- <property name="src" value="${home}/sources"/>
- <property name="testbase" value="${home}/testfiles"/>
- <!-- Directories derived from the JUnit base -->
- <property name="junit_jar" value="${junit-home}/junit-4.5.jar"/>
環境配置好之後可以開始編譯了。當然要保證你已經安裝好了ant編譯工具。執行ant。
view plain copy to clipboard print ?
- danny@danny-desktop:~/myproject/dedex$ ant
- Buildfile: build.xml
- init:
- [mkdir] Created dir: /home/danny/myproject/dedex/dedexer/classes
- compile:
- [javac] Compiling 48 source files to /home/danny/myproject/dedex/dedexer/classes
- [javac] Note: /home/danny/myproject/dedex/dedexer/sources/hu/uw/pallergabor/dedexer/Annotation.java uses unchecked or unsafe operations.
- [javac] Note: Recompile with -Xlint:unchecked for details.
- package:
- [jar] Building jar: /home/danny/myproject/dedex/dedexer/ddx.jar
- BUILD SUCCESSFUL
- Total time: 3 seconds
好了,編譯dedexer成功,隻用了3秒種,生成了ddx.jar檔案。我習慣修改一下它的檔案名,加上版本号。用來反編譯的指令如下:
view plain copy to clipboard print ?
- danny@danny-desktop:~/myproject/dedex$ java -jar ddx1.5.jar -d [target folder] classes.dex
- Processing hello/world/R$string
- Processing hello/world/R$layout
- Processing hello/world/hello
- Processing hello/world/R$attr
- Processing hello/world/R
- Processing hello/world/R$drawable
dedexer為每個class檔案生成了一個字尾為ddx的檔案。不出所料,有6個ddx檔案。
view plain copy to clipboard print ?
- danny@danny-desktop:~/myproject/dedex$ ls hello/world/
- R$attr.ddx R.ddx R$drawable.ddx R$layout.ddx R$string.ddx hello.ddx
看一下我們所關心的hello.ddx的内容。
view plain copy to clipboard print ?
- class public hello/world/hello
- .super android/app/Activity
- .source hello.java
- .method public <init>()V
- .line 7
- invoke-direct {v0},android/app/Activity/<init> ; <init>()V
- return-void
- .end method
- .method public onCreate(Landroid/os/Bundle;)V
- .line 11
- invoke-super {v2,v3},android/app/Activity/onCreate ; onCreate(Landroid/os/Bundle;)V
- .line 13
- new-instance v0,android/widget/TextView
- invoke-direct {v0,v2},android/widget/TextView/<init> ; <init>(Landroid/content/Context;)V
- .line 14
- const-string v1,"hello, OPhone"
- invoke-virtual {v0,v1},android/widget/TextView/setText ; setText(Ljava/lang/CharSequence;)V
- .line 15
- invoke-virtual {v2,v0},hello/world/hello/setContentView ; setContentView(Landroid/view/View;)V
- .line 16
- return-void
- .end method
從反編譯的結果來看,代碼的可讀性仍然比較差,但比dexdump相比要好一些。我們能夠看到“hello, OPhone”字元串是通過invoke-virtual {v0, v1}, android/widget/TextView/setText調用的。
dedexer與dexdump相比至少有3個優點。一,不需要在android模拟器中運作。二,把dex檔案按照java源代碼package的目錄結建構好了目錄,每個class檔案對應一個ddx檔案。不像dexdump那樣把所有的結果都放在一起。三,按照Dedexer作者的說法,可以把Dedexer作為一個像jasmin那樣的反編譯引擎,目前好多強大的java反編譯工具都是以jasmin作為反編譯引擎的。
五.結束語
本文簡單介紹了apk檔案的結構和内容,并介紹了反編譯工具Dedexer的用法。也希望我在這裡抛磚引玉,讓更多的高手了解apk檔案的結構,熟悉Dedexer這個反編譯引擎,将來寫出威力更高,可讀性更強的dex反編譯工具。網址為: