g729a修正与lib编译

天云上人 · 发表于 2011-6-8 16:07:23

到这里下载:http://xiaokotei.download.csdn.net/user/xiaokotei/all/
下载以后需要修改bits.c文件：
我仔细研究ITUG729代码后发现：
编码器的输出及解码器的输入不是编码生成的参数向量，而是经过1bit->Word16（即2字节）转换的bit流
，从而使得编码器输出数据不是原始PCM的1/16（理论上g.729编码和wav的文件的大小比例约为1:16），而实际上，我们采用他的coder编码出来的文件由于上述“串行化”的原因和原始wav几乎相同大，而且甚至比原始的wav还要大个十几K。

ITU-T为了在标准化方针中进行丢帧隐藏测试，对语音编解码器参考软件的码流格式一般需求为ITU-T G.192中规定的格式，即用16位的0x007F表示1个比特’0’，用0x0081表示1个比特’1’，每个帧头会有同步字和包的长度。对于同步字，0x6B20表示该帧为坏帧，0x6B21表示该帧为好帧。这样固然非常好，不过。。。导致了编码后数据的增大。

那么怎么来解决上述问题呢？解决的方法就是??去掉串行化代码，或重新编写串行化代码。
我们打开bits.c，就能看到里面定义的如下4个函数：
static void int2bin(int value, int no_of_bits, INT16 *bitstream);
static int bin2int(int no_of_bits, INT16 *bitstream);
void prm2bits_ld8k(int prm[], INT16 bits[]) ;
void bits2prm_ld8k(INT16 bits[], int prm[]) ;
这个文件就是编码后文件大小没有什么变化的关键所在了，能用如下的代码替换：
static void bit2byte(Word16 para,int bitlen,unsigned char * bits,int bitpos) ;
static Word16 byte2bit(int bitlen,unsigned char * bits,int bitpos) ;

void prm2bits_ld8k(Word16 *para,unsigned char *bits)
{
int i;
int bitpos = 0;
for (i = 0;i

void bit2byte(Word16 para,int bitlen,unsigned char * bits,int bitpos)
{
int i;
int bit = 0;
unsigned char newbyte = 0;

unsigned char *p = bits + (bitpos / 8);
for (i = 0 ;i > (bitlen - i -1) ) &0x01;
newbyte = (1
bitpos++;
if (bitpos % 8 == 0)
p++;
}
}

void bits2prm_ld8k(unsigned char *bits,Word16 *para)
{
int i;
int bitpos = 0;
for (i = 0;i

Word16 byte2bit(int bitlen,unsigned char * bits,int bitpos)
{
int i;
int bit = 0;
Word16 newbyte = 0;
Word16 value = 0;

unsigned char *p = bits + (bitpos / 8);
for (i = 0 ;i > (7 - bitpos % 8)) &0x01;
if (bit == 1) {
newbyte = (1
return value;
}
通过上述的修改，已能确保，每次一帧160个字节的pcm16音频数据流，能编码成为22个字节的编码参数prm，经过改写过的prm2bits_ld8k处理后，会转换成为10个字节的最终语音编码数据，这个时候，才真正体现出g.729a的威力。

编码器的代码能采用如下的修改方法
(1)修改coder.c：
unsigned char serial[SERIAL_SIZE]; /* 输出数据的数据类型由Word16改为unsigned char */
(2)修改coder.c文件，对编码器调用方式进行修改（关键部分代码）：
frame =0;
while( fread(new_speech, sizeof(Word16), L_FRAME, f_speech) == L_FRAME)
{
printf("Frame =%d＼r", frame++);
Pre_Process(new_speech, L_FRAME);
Coder_ld8a(prm);
prm2bits_ld8k( prm, serial);
fwrite(serial, 1, SERIAL_SIZE, f_serial);
}
return (0);

(3)把ld8a.h头文件中关于“串行化”长度的常量定义修改为10个字节：
#define SERIAL_SIZE 10

(4)解码器decoder.c进行类似的修改（关键部分代码）：
frame = 0;
while( fread(serial, 1, SERIAL_SIZE, f_serial) == SERIAL_SIZE)
{
printf("Frame =%d＼r", frame++);
bits2prm_ld8k(serial, &parm[1]); /* 注意这里一定要是&parm[1] */
parm[0] = 0; /* 假设没有丢帧 */
parm[4] = 0 ; /* 假设数据效验正常 */
Decod_ld8a(parm, synth, Az_dec, T2);
Post_Filter(synth, Az_dec, T2);
Post_Process(synth, L_FRAME);
fwrite(synth, sizeof(short), L_FRAME, f_syn);
}
return (0) ;
通过上面的修改，标准的ITU-T的G.729语音编码器和解码器就基本能达到1:16的编码效率了。

修改bits2prm_ld8k和prm2bits_ld8k之后的编码的数据其实也不是1/16的，因为编码器中的比特分配并不是均匀的，有的时候一个参数需要用5bit来表示，不过他并不是在内存中用5bit表示，而是用了一个word16来表示的。所以这样编码后得到的数据还是要比1/16大一些，原理上来讲，编完码后的prm[]大小应该是11（共11个参数），不过编码器的bits2prm()在其前面又加了一位校验是否丢包的校验位，这样1个block编码后的prm[0]这位实际上是个校验位。你要注意一下，解码器在读取编码后文件内容的时候，不是直接读取的字节，而是通过一个函数read_frame()，进行读取的，一个block读取prm[]大小为12。这样如果你把bits2prm去掉，编码后一个block用11个word16表示，不过解码的时候一次读取12个，这样就错了。所以需要对解码器作一下相应的修改，使他不再去关注那个prm[0]，一次读入11个数据。你看一下解码函数也会发现，在读入12个prm后，开头就是这么一句：bfi = *prm++，你把这个bfi作为参数传入函数，使其不再通过prm[0]得到，应该就能了。
封lib：
va_g729.h
#define L_FRAME_COMPRESSED 10
#define L_FRAME          80
#ifdef __cplusplus
extern "C" {
#endif
void va_g729a_init_encoder();
void va_g729a_encoder(short *speech, unsigned char *bitstream);
void va_g729a_init_decoder();
void va_g729a_decoder(unsigned char *bitstream, short *synth_short, int bfi);
#ifdef __cplusplus
}
#endif
va_g729.c
#include <stdio.h>
#include <stdlib.h>
#include "typedef.h"
#include "ld8k.h"
Word16 bad_lsf;
void va_g729a_init_encoder()
{
Init_Pre_Process();
Init_Coder_ld8k();
}
void va_g729a_encoder(short* SpeechBuf,unsigned char * serial)
{
extern Word16 *new_speech;    /* Pointer to new speech data          */
Word16 prm[PRM_SIZE];          /* Analysis parameters.             */
Word16 i;
Word16 syn[L_FRAME];
for(i=0;i<L_FRAME;i++)
{
new_speech = SpeechBuf;
1 G* D$ u3 v# x3 P" w4 s}
4 t! L( J. L0 {- v( w; v    for(i=0; i<PRM_SIZE; i++) prm = (Word16)0; " w+ _8 ~: _$ g; ~8 O7 I
Pre_Process(new_speech, L_FRAME);. K, \# u" g* Z+ n+ i( w/ O, y2 J
Coder_ld8k(prm,syn);
* l9 ~! ~( q3 ?3 d9 j& E2 i4 g. ? prm2bits_ld8k( prm, serial);
+ X) b6 ?. U! ?3 G6 ], h}8 v# d' k/ v4 M3 p0 \, s
void va_g729a_init_decoder()% L7 {3 h! k# k' d& q1 c2 q
{
" Q. }! C8 O5 y% y) c& lextern Word16 *synth;
5 ]& J) P5 u6 y( ]* j bad_lsf = 0;       /* Initialize bad LSF indicator */4 a; J# P2 Y. O+ Q5 r! @4 }# p
Init_Decod_ld8k();
7 j- x' F6 ?8 r  E5 F% ^( R/ | Init_Post_Filter();
" v6 ?7 o- E5 a6 v' C Init_Post_Process();/ |5 c) C3 B, `! V2 S2 S
}! R! x% j: o, `8 J: M' g
void va_g729a_decoder(unsigned char *serial, short *speech, int bfi), K! U4 e8 A4 y" n
{
. n* t- E) q" E% L4 Y* mextern Word16 *synth; /* Synthesis                */! ~/ W0 H& ?" r! {$ d+ l' W
Word16 synth_buf[L_FRAME+M];
* x: M7 d1 ]: ?3 jWord16 parm[PRM_SIZE+1];          /* Synthesis parameters       */
3 `+ c6 {& t: c& _4 J" s) fWord16 Az_dec[MP1*2], *ptr_Az;    /* Decoded Az for post-filter */
, Q9 \" G+ g% Y1 B, T) L% S9 sWord16 T2;                         /* Pitch lag for 2 subframes */: Z2 |6 N) K% o- ^- A
Word16 i;
  \6 R3 v6 ~! X7 {Word16 voicing = 60;; s/ |/ o+ ^' N
Word16 pst_out[L_FRAME];          /* Postfilter output          */: y) U; s& H: B/ H1 ?* w' j1 ]
Word16 sf_voic;                   /* voicing for subframe       */
8 x+ z" X1 d, t6 L" R* n- u- kvoicing = 60;* X( ?7 m& q* x- Y, W
bits2prm_ld8k( serial, &parm[1]);
0 C. @1 I# d; g$ W: D5 C parm[0] = 0;
0 V6 t1 U( X1 x/ t$ o
; z1 F! z3 P! x- W% q parm[4] = 0;//Check_Parity_Pitch(parm[3], parm[4]);7 C6 s  F9 K4 A
Decod_ld8k(parm, voicing, synth, Az_dec, &T2);3 f# C' _1 w! J  v
//--------------------------------------------------  D0 V6 P& X* i3 t
voicing = 0;5 Q+ }6 z8 l8 {$ i# h" ~" U. _
ptr_Az = Az_dec;
) C$ i+ \& \- r  c; U1 a. I7 Gfor(i=0; i<L_FRAME; i+=L_SUBFR) {
9 f: y& H' ^9 |. |3 ^, K3 o Post(T2, &synth, ptr_Az, &speech, &sf_voic);
# ^3 `( B. f3 X& y* p! k- x% ~) { if (sf_voic != 0) { voicing = sf_voic;}. u' M$ w' I1 T* {/ e7 M& ?
ptr_Az += MP1;
, e. k/ B6 V: w' u- @}
9 D# g' N: l/ k. sCopy(&synth_buf[L_FRAME], &synth_buf[0], M);
3 w" c6 J3 F+ z3 J' T//---------------------------------------------------
) r$ _. j% j: L+ y; e$ V4 S Post_Process(speech, L_FRAME); 9 x( f+ }: m2 `$ J' {
}; j2 q. c, T6 j0 P9 a# _0 a
5 S. Q1 E3 g9 }9 p( R# C

		自动登录	找回密码
密码			注册