0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何用替換函數(shù)的Trick做正常的事情

Linux閱碼場 ? 來源:未知 ? 作者:胡薇 ? 2018-11-23 11:00 ? 次閱讀

浙江溫州皮鞋濕,下雨進水不會胖。周六的雨夜,期待明天的雨會更大更冷。

已經(jīng)多久沒有編程了?很久了吧…其實我本來就不怎么會寫代碼,時不時的也就是為了驗證一個系統(tǒng)特性,寫點玩具而已,工程化的代碼,對于我而言,實在是吃力。

最近遇到一些問題,需要特定的解法,也就有機會手寫點代碼了。其實這個話題記得上一次遇到是在8年前,時間過得好快。

替換一個已經(jīng)在內(nèi)存中的函數(shù),使得執(zhí)行流流入我們自己的邏輯,然后再調(diào)用原始的函數(shù),這是一個很古老的話題了。比如有個函數(shù)叫做funcion,而你希望統(tǒng)計一下調(diào)用function的次數(shù),最直接的方法就是 如果有誰調(diào)用function的時候,調(diào)到下面這個就好了 :

void new_function()

{

count++;

return function();

}

網(wǎng)上很多文章給出了實現(xiàn)這個思路的Trick,而且一直以來計算機病毒也都采用了這種偷梁換柱的伎倆來實現(xiàn)自己的目的。然而,當你親自去測試時,發(fā)現(xiàn)事情并不那么簡單。

網(wǎng)上給出的許多方法均不再適用了,原因是在早期,這樣做的人比較少,處理器操作系統(tǒng)大可不必理會一些不符合常規(guī)的做法,但是隨著這類Trick開始做壞事影響到正常的業(yè)務(wù)邏輯時,處理器廠商以及操作系統(tǒng)廠商或者社區(qū)便不得不在底層增加一些限制性機制,以防止這類Trick繼續(xù)起作用。

常見的措施有兩點:

可執(zhí)行代碼段不可寫

這個措施便封堵住了你想通過簡單memcpy的方式替換函數(shù)指令的方案。

內(nèi)存buffer不可執(zhí)行

這個措施便封堵住了你想把執(zhí)行流jmp到你的一個保存指令的buffer的方案。

stack不可執(zhí)行

別看這些措施都比較low,一看誰都懂,它們卻避免了大量的緩沖區(qū)溢出帶來的危害。

那么如果我們想用替換函數(shù)的Trick做正常的事情,怎么辦?

我來簡單談一下我的方法。首先我不會去HOOK用戶態(tài)的進程的函數(shù),因為這樣意義不大,改一下重啟服務(wù)會好很多。所以說,本文特指HOOK內(nèi)核函數(shù)的做法。畢竟內(nèi)核重新編譯,重啟設(shè)備代價非常大。

我們知道,我們目前所使用的幾乎所有計算機都是馮諾伊曼式的統(tǒng)一存儲式計算機,即指令和數(shù)據(jù)是存在一起的,這就意味著我們必然可以在操作系統(tǒng)層面隨意解釋內(nèi)存空間的含義。

我們在做正當?shù)氖虑?,所以我假設(shè)我們已經(jīng)拿到了系統(tǒng)的root權(quán)限并且可以編譯和插入內(nèi)核模塊。那么接下來的事情似乎就是一個流程了。

是的,修改頁表項即可,即便無法簡單地通過memcpy來替換函數(shù)指令,我們還是可以用以下的步驟來進行指令替換:

重新將函數(shù)地址對應(yīng)的物理內(nèi)存映射成可寫;

用自己的jmp指令替換函數(shù)指令;

解除可寫映射。

非常幸運,內(nèi)核已經(jīng)有了現(xiàn)成的 text_poke/text_poke_smp 函數(shù)來完成上面的事情。

同樣的,針對一個堆上或者棧上分配的buffer不可執(zhí)行,我們依然有辦法。辦法如下:

編寫一個stub函數(shù),實現(xiàn)隨意,其代碼指令和buffer相當;

用上面重映射函數(shù)地址為可寫的方法用buffer重寫stub函數(shù);

將stub函數(shù)保存為要調(diào)用的函數(shù)指針。

是不是有點意思呢?下面是一個步驟示意圖:

下面是一個代碼,我稍后會針對這個代碼,說幾個細節(jié)方面的東西:

#include

#include

#include

#include

#include

#define OPTSIZE5

// saved_op保存跳轉(zhuǎn)到原始函數(shù)的指令

char saved_op[OPTSIZE] = {0};

// jump_op保存跳轉(zhuǎn)到hook函數(shù)的指令

char jump_op[OPTSIZE] = {0};

static unsigned int (*ptr_orig_conntrack_in)(const struct nf_hook_ops *ops, struct sk_buff *skb, const struct net_device *in, const struct net_device *out, const struct nf_hook_state *state);

static unsigned int (*ptr_ipv4_conntrack_in)(const struct nf_hook_ops *ops, struct sk_buff *skb, const struct net_device *in, const struct net_device *out, const struct nf_hook_state *state);

// stub函數(shù),最終將會被保存指令的buffer覆蓋掉

static unsigned int stub_ipv4_conntrack_in(const struct nf_hook_ops *ops, struct sk_buff *skb, const struct net_device *in, const struct net_device *out, const struct nf_hook_state *state)

{

printk("hook stub conntrack\n");

return 0;

}

// 這是我們的hook函數(shù),當內(nèi)核在調(diào)用ipv4_conntrack_in的時候,將會到達這個函數(shù)。

static unsigned int hook_ipv4_conntrack_in(const struct nf_hook_ops *ops, struct sk_buff *skb, const struct net_device *in, const struct net_device *out, const struct nf_hook_state *state)

{

printk("hook conntrack\n");

// 僅僅打印一行信息后,調(diào)用原始函數(shù)。

return ptr_orig_conntrack_in(ops, skb, in, out, state);

}

static void *(*ptr_poke_smp)(void *addr, const void *opcode, size_t len);

static __init int hook_conn_init(void)

{

s32 hook_offset, orig_offset;

// 這個poke函數(shù)完成的就是重映射,寫text段的事

ptr_poke_smp = kallsyms_lookup_name("text_poke_smp");

if (!ptr_poke_smp) {

printk("err");

return -1;

}

// 嗯,我們就是要hook住ipv4_conntrack_in,所以要先找到它!

ptr_ipv4_conntrack_in = kallsyms_lookup_name("ipv4_conntrack_in");

if (!ptr_ipv4_conntrack_in) {

printk("err");

return -1;

}

// 第一個字節(jié)當然是jump

jump_op[0] = 0xe9;

// 計算目標hook函數(shù)到當前位置的相對偏移

hook_offset = (s32)((long)hook_ipv4_conntrack_in - (long)ptr_ipv4_conntrack_in - OPTSIZE);

// 后面4個字節(jié)為一個相對偏移

(*(s32*)(&jump_op[1])) = hook_offset;

// 事實上,我們并沒有保存原始ipv4_conntrack_in函數(shù)的頭幾條指令,

// 而是直接jmp到了5條指令后的指令,對應(yīng)上圖,應(yīng)該是指令buffer里沒

// 有old inst,直接就是jmp y了,為什么呢?后面細說。

saved_op[0] = 0xe9;

// 計算目標原始函數(shù)將要執(zhí)行的位置到當前位置的偏移

orig_offset = (s32)((long)ptr_ipv4_conntrack_in + OPTSIZE - ((long)stub_ipv4_conntrack_in + OPTSIZE));

(*(s32*)(&saved_op[1])) = orig_offset;

get_online_cpus();

// 替換操作!

ptr_poke_smp(stub_ipv4_conntrack_in, saved_op, OPTSIZE);

ptr_orig_conntrack_in = stub_ipv4_conntrack_in;

barrier();

ptr_poke_smp(ptr_ipv4_conntrack_in, jump_op, OPTSIZE);

put_online_cpus();

return 0;

}

module_init(hook_conn_init);

static __exit void hook_conn_exit(void)

{

get_online_cpus();

ptr_poke_smp(ptr_ipv4_conntrack_in, saved_op, OPTSIZE);

ptr_poke_smp(stub_ipv4_conntrack_in, stub_op, OPTSIZE);

barrier();

put_online_cpus();

}

module_exit(hook_conn_exit);

MODULE_DESCRIPTION("hook test");

MODULE_LICENSE("GPL");

MODULE_VERSION("1.1");

測試是OK的。

在上面的代碼中,saved_op中為什么沒有old inst呢?直接就是一個jmp y,這豈不是將原始函數(shù)中的頭幾個字節(jié)的指令給遺漏了嗎?

其實說到這里,還真有個不好玩的Trick,起初我真的就是老老實實保存了前5個自己的指令,然后當需要調(diào)用原始ipv4_conntrack_in時,就先執(zhí)行那5個保存的指令,也是OK的。隨后我objdump這個函數(shù)發(fā)現(xiàn)了下面的代碼:

0000000000000380 :

380: e8 00 00 00 00 callq 385

385: 55 push %rbp

386: 49 8b 40 18 mov 0x18(%r8),%rax

38a: 48 89 f1 mov %rsi,%rcx

38d: 8b 57 2c mov 0x2c(%rdi),%edx

390: be 02 00 00 00 mov $0x2,%esi

395: 48 89 e5 mov %rsp,%rbp

398: 48 8b b8 e8 03 00 00 mov 0x3e8(%rax),%rdi

39f: e8 00 00 00 00 callq 3a4

3a4: 5d pop %rbp

3a5: c3 retq

3a6: 66 2e 0f 1f 84 00 00 nopw %cs:0x0(%rax,%rax,1)

3ad: 00 00 00

注意前5個指令: e8 00 00 00 00 callq 385

可以看到,這個是可以忽略的。因為不管怎么說都是緊接著執(zhí)行下面的指令。所以說,我就省去了inst的保存。

如果按照我的圖示中常規(guī)的方法的話,代碼稍微改一下即可:

char saved_op[OPTSIZE+OPTSIZE] = {0};

...

// 增加一個指令拷貝的操作

memcpy(saved_op, (unsigned char *)ptr_ipv4_conntrack_in, OPTSIZE);

saved_op[OPTSIZE] = 0xe9;

orig_offset = (s32)((long)ptr_ipv4_conntrack_in + OPTSIZE - ((long)stub_ipv4_conntrack_in + OPTSIZE + OPTSIZE));

(*(s32*)(&saved_op[OPTSIZE+1])) = orig_offset;

但是以上的只是玩具。

有個非常現(xiàn)實的問題。在我保存原始函數(shù)的頭n條指令的時候,n到底是多少呢?在本例中,顯然n是5,符合如今Linux內(nèi)核函數(shù)第一條指令幾乎都是callq xxx的慣例。

然而,如果一個函數(shù)的第一條指令是下面的樣子:

op d1 d2 d3 d4 d5

即一個操作碼需要5個操作數(shù),我要是只保存5個字節(jié),最后在stub中的指令將會是下面的樣子:

op d1 d2 d3 d4 0xe9 off1 off2 off3 off4

這顯然是錯誤的,op操作碼會將jmp指令0xe9解釋成操作數(shù)。

解藥呢?當然有咯。

我們不能魯莽地備份固定長度的指令,而是應(yīng)該這樣做:

curr = 0

if orig[0] 為單字節(jié)操作碼

saved_op[curr] = orig[curr];

curr++;

else if orig[0] 攜帶1個1字節(jié)操作數(shù)

memcpy(saved_op, orig, 2);

curr += 2;

else if orig[0] 攜帶2字節(jié)操作數(shù)

memcpy(saved_op, orig, 3);

curr += 3;

...

saved_op[curr] = 0xe9; // jmp

offset = ...

(*(s32*)(&saved_op[curr+1])) = offset;

這是正確的做法。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Linux
    +關(guān)注

    關(guān)注

    87

    文章

    11329

    瀏覽量

    209975
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4344

    瀏覽量

    62813

原文標題:Linux內(nèi)核如何替換內(nèi)核函數(shù)并調(diào)用原始函數(shù)

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    何用labview啟動

    何用labview啟動
    發(fā)表于 03-13 16:07

    何用Primff()函數(shù)打印串行端口信息?

    ”);// Uart可以打印串口信息?,F(xiàn)在,我想這樣:PrtTF(“Helon Test\r\n”);//“Helon Test\R\n”由串行工具恢復(fù)。所以,我的問題是如何用Primff()函數(shù)打印串行端口
    發(fā)表于 09-26 08:35

    GUI函數(shù)里面做了哪些事情,對顯示界面有何作用

    請問 GUI_TOUCH_Exec()函數(shù)里面做了哪些事情,對顯示界面有何作用?該函數(shù)的資料很難找到,請大家?guī)兔?。謝謝!
    發(fā)表于 06-03 04:35

    何用Matlab去實現(xiàn)FFT函數(shù)和IFFT函數(shù)

    Matlab的FFT函數(shù)和IFFT函數(shù)有什么用法嗎?如何用Matlab去實現(xiàn)FFT函數(shù)和IFFT函數(shù)呢?
    發(fā)表于 11-18 07:05

    何用printf()函數(shù)代替串口發(fā)送數(shù)據(jù)?

    何用printf()函數(shù)代替串口發(fā)送數(shù)據(jù)?
    發(fā)表于 12-01 08:01

    何用STM32通用定時器微秒延時函數(shù)?

    何用STM32通用定時器微秒延時函數(shù)?
    發(fā)表于 12-01 06:37

    何用__write函數(shù)替換掉原先的fputc函數(shù)

    何用__write函數(shù)替換掉原先的fputc函數(shù)呢?
    發(fā)表于 12-01 06:55

    何用2SC2539替換2SC1971

    何用2SC2539替換2SC1971
    發(fā)表于 12-22 11:40 ?3188次閱讀

    替換數(shù)組子集函數(shù)

    Labview之替換數(shù)組子集函數(shù),很好的Labview資料,快來下載學習吧。
    發(fā)表于 04-19 10:43 ?0次下載

    何用AD電路板邊框

    何用AD電路板邊框,感興趣的小伙伴們可以看看。
    發(fā)表于 07-26 10:43 ?0次下載

    matlab升級2021a版本后有哪些函數(shù)需要替換?

    使用新的函數(shù)進行替換!先到互聯(lián)網(wǎng)上搜索一下該函數(shù)的使用方法吧!因為無法在matlab里面運行此函數(shù)了,所以老函數(shù)的用法只能靠搜索來給大家
    的頭像 發(fā)表于 06-10 16:44 ?1w次閱讀

    在C++中如何用函數(shù)實現(xiàn)多態(tài)

    01 — C++虛函數(shù)探索 C++是一門面向?qū)ο笳Z言,在C++里運行時多態(tài)是由虛函數(shù)和純虛函數(shù)實現(xiàn)的,現(xiàn)在我們看下在C++中如何用函數(shù)實現(xiàn)
    的頭像 發(fā)表于 09-29 14:18 ?1718次閱讀

    C語言內(nèi)聯(lián)函數(shù)

    函數(shù)B很小,又被頻繁的調(diào)用,可能函數(shù)調(diào)用的切換時間比函數(shù)內(nèi)代碼的執(zhí)行時間還長,這樣明顯劃不來,那么我們就可以將這個函數(shù)聲明為內(nèi)聯(lián)(加上 inline ),編譯器在編譯時,會把內(nèi)聯(lián)
    的頭像 發(fā)表于 02-21 16:55 ?990次閱讀
    C語言內(nèi)聯(lián)<b class='flag-5'>函數(shù)</b>

    何用兩種不同的方法列寫雙容水槽傳遞函數(shù)

    何用兩種不同的方法列寫雙容水槽傳遞函數(shù)
    的頭像 發(fā)表于 03-10 16:20 ?3932次閱讀
    如<b class='flag-5'>何用</b>兩種不同的方法列寫雙容水槽傳遞<b class='flag-5'>函數(shù)</b>

    MySQL替換字符串函數(shù)REPLACE

    MySQL是目前非常流行的開源數(shù)據(jù)庫管理系統(tǒng)之一,它具有強大的功能和性能。其中之一的字符串函數(shù)REPLACE,可以用于替換字符串中的指定字符或字符串。在本文中,我們將詳細討論MySQL替換字符串
    的頭像 發(fā)表于 11-30 10:44 ?1591次閱讀