g729a修正与lib编译

天云上人 · 发表于 2011-6-8 16:07:23

到这里下载:http://xiaokotei.download.csdn.net/user/xiaokotei/all/
下载以后需要修改bits.c文件：
我仔细研究ITUG729代码后发现：
编码器的输出及解码器的输入不是编码生成的参数向量，而是经过1bit->Word16（即2字节）转换的bit流
，从而使得编码器输出数据不是原始PCM的1/16（理论上g.729编码和wav的文件的大小比例约为1:16），而实际上，我们采用他的coder编码出来的文件由于上述“串行化”的原因和原始wav几乎相同大，而且甚至比原始的wav还要大个十几K。

ITU-T为了在标准化方针中进行丢帧隐藏测试，对语音编解码器参考软件的码流格式一般需求为ITU-T G.192中规定的格式，即用16位的0x007F表示1个比特’0’，用0x0081表示1个比特’1’，每个帧头会有同步字和包的长度。对于同步字，0x6B20表示该帧为坏帧，0x6B21表示该帧为好帧。这样固然非常好，不过。。。导致了编码后数据的增大。

那么怎么来解决上述问题呢？解决的方法就是??去掉串行化代码，或重新编写串行化代码。
我们打开bits.c，就能看到里面定义的如下4个函数：
static void int2bin(int value, int no_of_bits, INT16 *bitstream);
static int bin2int(int no_of_bits, INT16 *bitstream);
void prm2bits_ld8k(int prm[], INT16 bits[]) ;
void bits2prm_ld8k(INT16 bits[], int prm[]) ;
这个文件就是编码后文件大小没有什么变化的关键所在了，能用如下的代码替换：
static void bit2byte(Word16 para,int bitlen,unsigned char * bits,int bitpos) ;
static Word16 byte2bit(int bitlen,unsigned char * bits,int bitpos) ;

void prm2bits_ld8k(Word16 *para,unsigned char *bits)
{
int i;
int bitpos = 0;
for (i = 0;i

void bit2byte(Word16 para,int bitlen,unsigned char * bits,int bitpos)
{
int i;
int bit = 0;
unsigned char newbyte = 0;

unsigned char *p = bits + (bitpos / 8);
for (i = 0 ;i > (bitlen - i -1) ) &0x01;
newbyte = (1
bitpos++;
if (bitpos % 8 == 0)
p++;
}
}

void bits2prm_ld8k(unsigned char *bits,Word16 *para)
{
int i;
int bitpos = 0;
for (i = 0;i

Word16 byte2bit(int bitlen,unsigned char * bits,int bitpos)
{
int i;
int bit = 0;
Word16 newbyte = 0;
Word16 value = 0;

unsigned char *p = bits + (bitpos / 8);
for (i = 0 ;i > (7 - bitpos % 8)) &0x01;
if (bit == 1) {
newbyte = (1
return value;
}
通过上述的修改，已能确保，每次一帧160个字节的pcm16音频数据流，能编码成为22个字节的编码参数prm，经过改写过的prm2bits_ld8k处理后，会转换成为10个字节的最终语音编码数据，这个时候，才真正体现出g.729a的威力。

编码器的代码能采用如下的修改方法
(1)修改coder.c：
unsigned char serial[SERIAL_SIZE]; /* 输出数据的数据类型由Word16改为unsigned char */
(2)修改coder.c文件，对编码器调用方式进行修改（关键部分代码）：
frame =0;
while( fread(new_speech, sizeof(Word16), L_FRAME, f_speech) == L_FRAME)
{
printf("Frame =%d＼r", frame++);
Pre_Process(new_speech, L_FRAME);
Coder_ld8a(prm);
prm2bits_ld8k( prm, serial);
fwrite(serial, 1, SERIAL_SIZE, f_serial);
}
return (0);

(3)把ld8a.h头文件中关于“串行化”长度的常量定义修改为10个字节：
#define SERIAL_SIZE 10

(4)解码器decoder.c进行类似的修改（关键部分代码）：
frame = 0;
while( fread(serial, 1, SERIAL_SIZE, f_serial) == SERIAL_SIZE)
{
printf("Frame =%d＼r", frame++);
bits2prm_ld8k(serial, &parm[1]); /* 注意这里一定要是&parm[1] */
parm[0] = 0; /* 假设没有丢帧 */
parm[4] = 0 ; /* 假设数据效验正常 */
Decod_ld8a(parm, synth, Az_dec, T2);
Post_Filter(synth, Az_dec, T2);
Post_Process(synth, L_FRAME);
fwrite(synth, sizeof(short), L_FRAME, f_syn);
}
return (0) ;
通过上面的修改，标准的ITU-T的G.729语音编码器和解码器就基本能达到1:16的编码效率了。

修改bits2prm_ld8k和prm2bits_ld8k之后的编码的数据其实也不是1/16的，因为编码器中的比特分配并不是均匀的，有的时候一个参数需要用5bit来表示，不过他并不是在内存中用5bit表示，而是用了一个word16来表示的。所以这样编码后得到的数据还是要比1/16大一些，原理上来讲，编完码后的prm[]大小应该是11（共11个参数），不过编码器的bits2prm()在其前面又加了一位校验是否丢包的校验位，这样1个block编码后的prm[0]这位实际上是个校验位。你要注意一下，解码器在读取编码后文件内容的时候，不是直接读取的字节，而是通过一个函数read_frame()，进行读取的，一个block读取prm[]大小为12。这样如果你把bits2prm去掉，编码后一个block用11个word16表示，不过解码的时候一次读取12个，这样就错了。所以需要对解码器作一下相应的修改，使他不再去关注那个prm[0]，一次读入11个数据。你看一下解码函数也会发现，在读入12个prm后，开头就是这么一句：bfi = *prm++，你把这个bfi作为参数传入函数，使其不再通过prm[0]得到，应该就能了。
封lib：
va_g729.h
#define L_FRAME_COMPRESSED 10
#define L_FRAME          80
#ifdef __cplusplus
extern "C" {
#endif
void va_g729a_init_encoder();
void va_g729a_encoder(short *speech, unsigned char *bitstream);
void va_g729a_init_decoder();
void va_g729a_decoder(unsigned char *bitstream, short *synth_short, int bfi);
#ifdef __cplusplus
}
#endif
va_g729.c
#include <stdio.h>
#include <stdlib.h>
#include "typedef.h"
#include "ld8k.h"
Word16 bad_lsf;
void va_g729a_init_encoder()
{
Init_Pre_Process();
Init_Coder_ld8k();
}
void va_g729a_encoder(short* SpeechBuf,unsigned char * serial)
{
extern Word16 *new_speech;    /* Pointer to new speech data          */
Word16 prm[PRM_SIZE];          /* Analysis parameters.             */
Word16 i;
Word16 syn[L_FRAME];
for(i=0;i<L_FRAME;i++)
{
new_speech = SpeechBuf;7 f; J# `  n  E3 T0 @
}
. T4 u5 a" x* O" {$ H( q    for(i=0; i<PRM_SIZE; i++) prm = (Word16)0;
1 f7 m! r; d8 t3 z- h; D: R$ P Pre_Process(new_speech, L_FRAME);
, o; T- q& d$ ~7 D1 d- |6 L Coder_ld8k(prm,syn);
* c4 e8 o+ t" h( z0 c+ E prm2bits_ld8k( prm, serial);# P) E+ M! D; c" S  }  [, [
}( ]& g+ e' y! N% e9 {" X
void va_g729a_init_decoder()
$ h( g! J5 y$ t6 f+ n# N  k{
+ |, o) |' ?9 d0 N) f# Vextern Word16 *synth;$ c4 i8 Z8 ~( b  P4 I" V
bad_lsf = 0;       /* Initialize bad LSF indicator */
" R! q% e4 q) ] Init_Decod_ld8k();
: K& ?' A) _1 `+ s8 o. D0 M  |9 c Init_Post_Filter();
4 s0 h8 s: U( v. [; o Init_Post_Process();& K; ?! G6 d  u  F% g& t
}& `9 m+ z" a( _- N2 Y% Z! K( P1 H2 f
void va_g729a_decoder(unsigned char *serial, short *speech, int bfi)
, U+ G1 {9 T9 u, e# a/ G+ S1 f; W8 e{, l+ H4 Q6 t2 l' T0 ]% J8 V
extern Word16 *synth; /* Synthesis                */% k5 a: u7 p7 u. F+ R. |! d( d
Word16 synth_buf[L_FRAME+M];" L# |5 b# t8 M9 z+ b1 H
Word16 parm[PRM_SIZE+1];          /* Synthesis parameters       */5 `3 ?: ^- S. t# }+ P
Word16 Az_dec[MP1*2], *ptr_Az;    /* Decoded Az for post-filter */
  J* P/ k1 u7 wWord16 T2;                         /* Pitch lag for 2 subframes */3 F; O% C; i. n- w/ M
Word16 i;
; A2 A, x/ G- t% N3 d# F! j) _3 bWord16 voicing = 60;
: l! f- ]# s9 O2 {0 ?Word16 pst_out[L_FRAME];          /* Postfilter output          */8 g( T. r% D. L, r* a; d% E
Word16 sf_voic;                   /* voicing for subframe       */
. I( L  M# X4 R! u2 d2 s  |voicing = 60;2 J" g0 _, X/ O7 u& v
bits2prm_ld8k( serial, &parm[1]);
4 N" Y, j. ^' ?( ? parm[0] = 0;
* F* k; X8 c) D- ~# r% q; r  w/ b       ; s0 H/ T; Q% {7 L
parm[4] = 0;//Check_Parity_Pitch(parm[3], parm[4]);
' F! V! |; O; s9 b4 qDecod_ld8k(parm, voicing, synth, Az_dec, &T2);" ?' k+ Q: o& [2 O1 o& B+ D
//--------------------------------------------------
/ x$ m. \- |7 l: c* f; Mvoicing = 0;
% u, j1 W+ D" S) ]8 j' g. b* U; mptr_Az = Az_dec;
) M! m1 ?* k: G0 z+ Ifor(i=0; i<L_FRAME; i+=L_SUBFR) {8 w8 l# {4 M, H: C7 Q
Post(T2, &synth, ptr_Az, &speech, &sf_voic);6 y4 o4 ^$ Y* W  R: I+ {7 z$ m
if (sf_voic != 0) { voicing = sf_voic;}9 }# L  N; n" n2 O$ T5 \1 H
ptr_Az += MP1;4 l; y& @6 G0 a: B
}1 n0 Q# {& v! k
Copy(&synth_buf[L_FRAME], &synth_buf[0], M);
  a* T8 q! b! O0 k; U! c) ^//---------------------------------------------------! I$ k) _8 \5 T
Post_Process(speech, L_FRAME); & k7 L& h1 m4 J. c
}& Q) |* A9 P7 x' g

9 B! l- s6 [, t  K

		自动登录	找回密码
密码			注册

g729a修正与lib编译

浏览过的版块