找回密码
 注册
搜索
查看: 5051|回复: 0

C语言高效编程的几招

[复制链接]
发表于 2006-11-14 15:25:09 | 显示全部楼层 |阅读模式
引言:
7 d0 Z. Z' u3 G2 V; I' x% M4 F  编写高效简洁的C语言代码,是许多软件工程师追求的目标。本文就工作中的一些体会和经验做相关的阐述,不对的地方请各位指教。% G1 x6 n3 L/ }; |2 U5 c/ T! u3 F% L

4 `  `5 B6 _! r第1招:以空间换时间  n# e5 S. I# [' N1 L. Y
) ~: U& d/ Y/ Q- A8 o! J- W/ K+ @- ]
  计算机程序中最大的矛盾是空间和时间的矛盾,那么,从这个角度出发逆向思维来考虑程序的效率问题,我们就有了解决问题的第1招——以空间换时间。4 Q' r+ T! N7 a; d) x
例如:字符串的赋值。& g$ I3 Y) z3 ]1 f- p6 L3 ^
方法A,通常的办法:
0 y; {4 Q/ \1 b8 t#define LEN 32
' Z+ n/ U4 B$ d/ E1 \1 bchar string1 [LEN];& }: w" Y( z6 |/ ^: c8 U- ^0 a
memset (string1,0,LEN);3 p1 I6 Z2 K( k- ~4 B
strcpy (string1,“This is a example!!”);/ g0 O; d1 t; S# O- u" Y
方法B:( q% F* m. y# N/ A  N5 {
const char string2[LEN] =“This is a example!”;
! o; d4 q$ T% wchar * cp;' F2 B& }/ j' ]/ N- U
cp = string2 ;" b" H" B8 f% f( ]  d
(使用的时候可以直接用指针来操作。)5 N( Y; [5 V* J3 |7 M7 G

2 x/ w# _& Q: }" n) O* K9 r  从上面的例子可以看出,A和B的效率是不能比的。在同样的存储空间下,B直接使用指针就可以操作了,而A需要调用两个字符函数才能完成。B的缺点在于灵活性没有A好。在需要频繁更改一个字符串内容的时候,A具有更好的灵活性;如果采用方法B,则需要预存许多字符串,虽然占用了大量的内存,但是获得了程序执行的高效率。
8 l" z9 M( ]. Y/ F9 a1 a
- N5 @9 s9 H/ S% x- E& c- \' S8 E  如果系统的实时性要求很高,内存还有一些,那我推荐你使用该招数。# @) h- t) L3 I! r% f

4 e6 V% x- ^2 P0 O, G0 G  该招数的变招——使用宏函数而不是函数。举例如下:+ f! r6 S- F8 x  T9 [# s# A; t
方法C:4 f+ y! y3 `/ i- x3 w& k) ^
#define bwMCDR2_ADDRESS 4' d) c# ~5 B, j8 N
#define bsMCDR2_ADDRESS 17$ A3 K1 H; k* M% C# B5 P& |3 i
int BIT_MASK(int __bf)
( F7 v+ J, i" r{6 P9 L2 k, M2 x( g9 m3 a! X
return ((1U << (bw ## __bf)) - 1) << (bs ## __bf);. {5 M3 O  b2 t8 K; W! n
}
- m5 {6 H7 r" M3 dvoid SET_BITS(int __dst, int __bf, int __val)- R8 G1 U% |+ i3 _* j6 s0 y0 \
{4 i+ r8 {7 [, A% c/ _# r
__dst = ((__dst) & ~(BIT_MASK(__bf))) | \
: n: F. L- m, Y9 N! o6 d(((__val) << (bs ## __bf)) & (BIT_MASK(__bf))))) Q1 O3 t  D8 t7 |& N1 G  F3 r- X
}
( _6 z/ n- b: v, g8 h, S9 k4 Z5 |9 ~4 x3 ~! q) c! ]5 a7 C) k+ H
SET_BITS(MCDR2, MCDR2_ADDRESS, RegisterNumber);
3 e$ ?6 B% c2 T! w1 m' W" M& v方法D:* g* ~$ f9 q6 T5 d6 m
#define bwMCDR2_ADDRESS 4
- i9 g* G/ `3 [; s#define bsMCDR2_ADDRESS 174 e& ~& R  r8 Y: O+ v4 O$ {2 @
#define bmMCDR2_ADDRESS BIT_MASK(MCDR2_ADDRESS)3 v" q; b- [) ^" R1 h% y7 F: P5 Q4 U
#define BIT_MASK(__bf) (((1U << (bw ## __bf)) - 1) << (bs ## __bf))5 K, r8 C! A" r7 G" d
#define SET_BITS(__dst, __bf, __val) \
# Z; m! G! ]! A0 ]4 `((__dst) = ((__dst) & ~(BIT_MASK(__bf))) | \
  w$ R' o; w! P1 D(((__val) << (bs ## __bf)) & (BIT_MASK(__bf))))8 j# r( |* O( F

! k: u: c' n2 d6 V4 SSET_BITS(MCDR2, MCDR2_ADDRESS, RegisterNumber);
9 U  \* q: k) A$ a" \: \2 T
, Z& |+ s, B  y7 C  函数和宏函数的区别就在于,宏函数占用了大量的空间,而函数占用了时间。大家要知道的是,函数调用是要使用系统的栈来保存数据的,如果编译器里有栈检查选项,一般在函数的头会嵌入一些汇编语句对当前栈进行检查;同时,CPU也要在函数调用时保存和恢复当前的现场,进行压栈和弹栈操作,所以,函数调用需要一些CPU时间。而宏函数不存在这个问题。宏函数仅仅作为预先写好的代码嵌入到当前程序,不会产生函数调用,所以仅仅是占用了空间,在频繁调用同一个宏函数的时候,该现象尤其突出。- z- |7 B2 G7 V* {( E$ M. h

, L6 P0 ]- V6 F! r& r6 ?  D方法是我看到的最好的置位操作函数,是ARM公司源码的一部分,在短短的三行内实现了很多功能,几乎涵盖了所有的位操作功能。C方法是其变体,其中滋味还需大家仔细体会。" w/ |4 ^. m) w4 A7 n4 _9 D* L
) \$ U% G5 O" V$ x# Z
第2招:数学方法解决问题
. Q% \4 }' X) o! b0 W9 L5 z3 @; a" c# B* O+ t+ J
  现在我们演绎高效C语言编写的第二招——采用数学方法来解决问题。
3 R2 w3 U8 ]1 ?9 t" i
  b* T# H' Y0 {7 W% y  数学是计算机之母,没有数学的依据和基础,就没有计算机的发展,所以在编写程序的时候,采用一些数学方法会对程序的执行效率有数量级的提高。+ g7 n) u1 N" d- O
举例如下,求 1~100的和。
0 p0 S  S# E/ v  n* X方法E2 f1 W( h) ?5 V# B& P' S
int I , j;
' r/ P) Y6 q0 i- \- O# g9 U2 j" Ffor (I = 1 ;I<=100; I ++){3 |: R% B) n+ r+ O$ n9 u1 w4 D
j += I;  p/ v5 \$ N# v1 b3 |8 C6 b
}
' h* @6 r3 w' N方法F( ?( t  O0 `8 C% D
int I;
7 V! \7 R3 x. PI = (100 * (1+100)) / 23 Z8 Z) F* K( d$ n( C
! X2 P) g5 f0 Z- O8 v
  这个例子是我印象最深的一个数学用例,是我的计算机启蒙老师考我的。当时我只有小学三年级,可惜我当时不知道用公式 N×(N+1)/ 2 来解决这个问题。方法E循环了100次才解决问题,也就是说最少用了100个赋值,100个判断,200个加法(I和j);而方法F仅仅用了1个加法,1 次乘法,1次除法。效果自然不言而喻。所以,现在我在编程序的时候,更多的是动脑筋找规律,最大限度地发挥数学的威力来提高程序运行的效率。( x) c  |" n' W

; i9 E1 `, {5 W+ @6 p# }第3招:使用位操作2 S# J$ d+ R: E* y# }& m

7 a% h: D9 r1 P  实现高效的C语言编写的第三招——使用位操作,减少除法和取模的运算。2 V7 F  y6 J/ M) o8 @4 p% _
" g# k" S/ n- T/ ~1 N
  在计算机程序中,数据的位是可以操作的最小数据单位,理论上可以用“位运算”来完成所有的运算和操作。一般的位操作是用来控制硬件的,或者做数据变换使用,但是,灵活的位操作可以有效地提高程序运行的效率。举例如下:
$ C; \: ~' w5 U5 K. c. c' i方法G. l8 g4 Y. \( M9 @# b
int I,J;
: o: X  J; |( Y0 R, {  yI = 257 /8;
! `* s! @) g! m. l. EJ = 456 % 32;
9 T  g. r% K' O5 P( M方法H
5 p2 w# i& M3 H' r& oint I,J;2 |, h) s! @3 S0 o3 w7 U; c0 |
I = 257 >>3;
1 X# a& s& L: Y6 Y1 [J = 456 - (456 >> 4 << 4);0 W6 x9 i) `2 F0 e( H) n

- z% o$ [9 a# b, y, _  在字面上好像H比G麻烦了好多,但是,仔细查看产生的汇编代码就会明白,方法G调用了基本的取模函数和除法函数,既有函数调用,还有很多汇编代码和寄存器参与运算;而方法H则仅仅是几句相关的汇编,代码更简洁,效率更高。当然,由于编译器的不同,可能效率的差距不大,但是,以我目前遇到的MS C ,ARM C 来看,效率的差距还是不小。相关汇编代码就不在这里列举了。
  m/ u$ X* i6 f1 ^4 N运用这招需要注意的是,因为CPU的不同而产生的问题。比如说,在PC上用这招编写的程序,并在PC上调试通过,在移植到一个16位机平台上的时候,可能会产生代码隐患。所以只有在一定技术进阶的基础下才可以使用这招。
; w' ]) u4 J! h7 T) h! V: @+ Y) b0 D4 R- z* L- s# P0 C
第4招:汇编嵌入
$ |: J$ V" p2 L* k8 s$ Q
+ }4 p/ V% Y& i/ E3 F! \  k4 J: K  高效C语言编程的必杀技,第四招——嵌入汇编。
. m+ R( ]9 L, c
/ x) z1 c3 a2 P2 j1 T  “在熟悉汇编语言的人眼里,C语言编写的程序都是垃圾”。这种说法虽然偏激了一些,但是却有它的道理。汇编语言是效率最高的计算机语言,但是,不可能靠着它来写一个操作系统吧?所以,为了获得程序的高效率,我们只好采用变通的方法 ——嵌入汇编,混合编程。
8 n: v1 t$ C* ^) M; E+ Z$ M' f# ?' _  B+ E6 ~
  举例如下,将数组一赋值给数组二,要求每一字节都相符。2 R  K3 j, p0 I% X1 S  n7 F$ X  U- D
char string1[1024],string2[1024];
6 J+ @+ ~6 T) k方法I) z/ n" g4 {! o7 {" \
int I;
( _8 \- F/ a4 Q6 Wfor (I =0 ;I<1024;I++)0 b: |( j6 r, o' o0 q3 c9 [; J' w
*(string2 + I) = *(string1 + I)
# [1 J# A. Y3 Y( m9 W1 z& M方法J
% N8 H  S. Y2 _/ v1 x9 z#ifdef _PC_
9 p. ]# t1 e" N5 Z% E0 R! `6 ~int I;+ j( [6 m* N+ m& S/ S
for (I =0 ;I<1024;I++)
. n5 B6 h) i4 O  D, u  \*(string2 + I) = *(string1 + I);
1 n4 B6 I# j. k9 H0 _+ {* Q) P#else9 |, }+ w& T2 E4 Z
#ifdef _ARM_
. {) N1 [1 S& ?$ K6 ?& \) H__asm, F& m( G9 N; C8 \
{
7 R+ X) [3 p4 `0 fMOV R0,string1
& [+ s; Q3 C( XMOV R1,string2. g: ?7 ?, `9 X9 C! _* a
MOV R2,#0
- \. B' X4 }0 [' M% b8 e" mloop:
+ N5 i1 F& W: W4 K0 l6 @, rLDMIA R0!, [R3-R11]! _1 Y  u5 E  S# p( H: M
STMIA R1!, [R3-R11]
: |; `# i, }- ?4 _% r, r9 RADD R2,R2,#8
1 ^% n' r/ M! [0 HCMP R2, #400
3 e! n4 v! o7 k4 |9 L! e: h# BBNE loop
( T( R) Q6 U; h- a! l4 p}
6 L3 [& U( {/ J* c# Z#endif. C% i1 T* ]& ?
! O% ]) M' n  c6 t, |* y7 B: F
  方法I是最常见的方法,使用了1024次循环;方法J则根据平台不同做了区分,在ARM平台下,用嵌入汇编仅用128次循环就完成了同样的操作。这里有朋友会说,为什么不用标准的内存拷贝函数呢?这是因为在源数据里可能含有数据为0的字节,这样的话,标准库函数会提前结束而不会完成我们要求的操作。这个例程典型应用于LCD数据的拷贝过程。根据不同的CPU,熟练使用相应的嵌入汇编,可以大大提高程序执行的效率。+ h0 \5 R- E# c9 {
; d. F' c) E, Q5 p( J+ W
  虽然是必杀技,但是如果轻易使用会付出惨重的代价。这是因为,使用了嵌入汇编,便限制了程序的可移植性,使程序在不同平台移植的过程中,卧虎藏龙,险象环生!同时该招数也与现代软件工程的思想相违背,只有在迫不得已的情况下才可以采用。切记,切记。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|宁德市腾云网络科技有限公司 ( 闽ICP备2022007940号-5|闽公网安备 35092202000206号 )

GMT+8, 2025-8-9 09:09 , Processed in 0.033981 second(s), 15 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表