g729a修正与lib编译

天云上人 · 发表于 2011-6-8 16:07:23

到这里下载:http://xiaokotei.download.csdn.net/user/xiaokotei/all/
下载以后需要修改bits.c文件：
我仔细研究ITUG729代码后发现：
编码器的输出及解码器的输入不是编码生成的参数向量，而是经过1bit->Word16（即2字节）转换的bit流
，从而使得编码器输出数据不是原始PCM的1/16（理论上g.729编码和wav的文件的大小比例约为1:16），而实际上，我们采用他的coder编码出来的文件由于上述“串行化”的原因和原始wav几乎相同大，而且甚至比原始的wav还要大个十几K。

ITU-T为了在标准化方针中进行丢帧隐藏测试，对语音编解码器参考软件的码流格式一般需求为ITU-T G.192中规定的格式，即用16位的0x007F表示1个比特’0’，用0x0081表示1个比特’1’，每个帧头会有同步字和包的长度。对于同步字，0x6B20表示该帧为坏帧，0x6B21表示该帧为好帧。这样固然非常好，不过。。。导致了编码后数据的增大。

那么怎么来解决上述问题呢？解决的方法就是??去掉串行化代码，或重新编写串行化代码。
我们打开bits.c，就能看到里面定义的如下4个函数：
static void int2bin(int value, int no_of_bits, INT16 *bitstream);
static int bin2int(int no_of_bits, INT16 *bitstream);
void prm2bits_ld8k(int prm[], INT16 bits[]) ;
void bits2prm_ld8k(INT16 bits[], int prm[]) ;
这个文件就是编码后文件大小没有什么变化的关键所在了，能用如下的代码替换：
static void bit2byte(Word16 para,int bitlen,unsigned char * bits,int bitpos) ;
static Word16 byte2bit(int bitlen,unsigned char * bits,int bitpos) ;

void prm2bits_ld8k(Word16 *para,unsigned char *bits)
{
int i;
int bitpos = 0;
for (i = 0;i

void bit2byte(Word16 para,int bitlen,unsigned char * bits,int bitpos)
{
int i;
int bit = 0;
unsigned char newbyte = 0;

unsigned char *p = bits + (bitpos / 8);
for (i = 0 ;i > (bitlen - i -1) ) &0x01;
newbyte = (1
bitpos++;
if (bitpos % 8 == 0)
p++;
}
}

void bits2prm_ld8k(unsigned char *bits,Word16 *para)
{
int i;
int bitpos = 0;
for (i = 0;i

Word16 byte2bit(int bitlen,unsigned char * bits,int bitpos)
{
int i;
int bit = 0;
Word16 newbyte = 0;
Word16 value = 0;

unsigned char *p = bits + (bitpos / 8);
for (i = 0 ;i > (7 - bitpos % 8)) &0x01;
if (bit == 1) {
newbyte = (1
return value;
}
通过上述的修改，已能确保，每次一帧160个字节的pcm16音频数据流，能编码成为22个字节的编码参数prm，经过改写过的prm2bits_ld8k处理后，会转换成为10个字节的最终语音编码数据，这个时候，才真正体现出g.729a的威力。

编码器的代码能采用如下的修改方法
(1)修改coder.c：
unsigned char serial[SERIAL_SIZE]; /* 输出数据的数据类型由Word16改为unsigned char */
(2)修改coder.c文件，对编码器调用方式进行修改（关键部分代码）：
frame =0;
while( fread(new_speech, sizeof(Word16), L_FRAME, f_speech) == L_FRAME)
{
printf("Frame =%d＼r", frame++);
Pre_Process(new_speech, L_FRAME);
Coder_ld8a(prm);
prm2bits_ld8k( prm, serial);
fwrite(serial, 1, SERIAL_SIZE, f_serial);
}
return (0);

(3)把ld8a.h头文件中关于“串行化”长度的常量定义修改为10个字节：
#define SERIAL_SIZE 10

(4)解码器decoder.c进行类似的修改（关键部分代码）：
frame = 0;
while( fread(serial, 1, SERIAL_SIZE, f_serial) == SERIAL_SIZE)
{
printf("Frame =%d＼r", frame++);
bits2prm_ld8k(serial, &parm[1]); /* 注意这里一定要是&parm[1] */
parm[0] = 0; /* 假设没有丢帧 */
parm[4] = 0 ; /* 假设数据效验正常 */
Decod_ld8a(parm, synth, Az_dec, T2);
Post_Filter(synth, Az_dec, T2);
Post_Process(synth, L_FRAME);
fwrite(synth, sizeof(short), L_FRAME, f_syn);
}
return (0) ;
通过上面的修改，标准的ITU-T的G.729语音编码器和解码器就基本能达到1:16的编码效率了。

修改bits2prm_ld8k和prm2bits_ld8k之后的编码的数据其实也不是1/16的，因为编码器中的比特分配并不是均匀的，有的时候一个参数需要用5bit来表示，不过他并不是在内存中用5bit表示，而是用了一个word16来表示的。所以这样编码后得到的数据还是要比1/16大一些，原理上来讲，编完码后的prm[]大小应该是11（共11个参数），不过编码器的bits2prm()在其前面又加了一位校验是否丢包的校验位，这样1个block编码后的prm[0]这位实际上是个校验位。你要注意一下，解码器在读取编码后文件内容的时候，不是直接读取的字节，而是通过一个函数read_frame()，进行读取的，一个block读取prm[]大小为12。这样如果你把bits2prm去掉，编码后一个block用11个word16表示，不过解码的时候一次读取12个，这样就错了。所以需要对解码器作一下相应的修改，使他不再去关注那个prm[0]，一次读入11个数据。你看一下解码函数也会发现，在读入12个prm后，开头就是这么一句：bfi = *prm++，你把这个bfi作为参数传入函数，使其不再通过prm[0]得到，应该就能了。
封lib：
va_g729.h
#define L_FRAME_COMPRESSED 10
#define L_FRAME          80
#ifdef __cplusplus
extern "C" {
#endif
void va_g729a_init_encoder();
void va_g729a_encoder(short *speech, unsigned char *bitstream);
void va_g729a_init_decoder();
void va_g729a_decoder(unsigned char *bitstream, short *synth_short, int bfi);
#ifdef __cplusplus
}
#endif
va_g729.c
#include <stdio.h>
#include <stdlib.h>
#include "typedef.h"
#include "ld8k.h"
Word16 bad_lsf;
void va_g729a_init_encoder()
{
Init_Pre_Process();
Init_Coder_ld8k();
}
void va_g729a_encoder(short* SpeechBuf,unsigned char * serial)
{
extern Word16 *new_speech;    /* Pointer to new speech data          */
Word16 prm[PRM_SIZE];          /* Analysis parameters.             */
Word16 i;
Word16 syn[L_FRAME];
for(i=0;i<L_FRAME;i++)
{
new_speech = SpeechBuf;
# R$ c% R. S6 ^* a+ l8 Z}- m$ Y' w  V1 l, o: x( H
   for(i=0; i<PRM_SIZE; i++) prm = (Word16)0;
& i6 t* N, r% Y4 i# l6 u Pre_Process(new_speech, L_FRAME);
6 O9 F9 R3 k. _ Coder_ld8k(prm,syn);8 i" m0 |* h& B8 i$ M
prm2bits_ld8k( prm, serial);
5 I* v2 {2 @. `' H3 g' U8 P( h+ X}2 F. S  c% V3 J
void va_g729a_init_decoder()
3 [1 B1 [! y5 h{
7 z  j3 x" q- g6 V* Pextern Word16 *synth;/ x. ^8 p' l' R# h9 X4 A
bad_lsf = 0;       /* Initialize bad LSF indicator */
1 u8 B; C: ]1 \ Init_Decod_ld8k();
3 v7 J6 Q6 p, t: \' R: X5 l6 I Init_Post_Filter();
2 U# n" k- y/ z. ~- a Init_Post_Process();
) j( V3 l( l) X& b8 R! V1 R}" i# V( H+ `8 b5 P% ^; c: l
void va_g729a_decoder(unsigned char *serial, short *speech, int bfi)0 [5 {( e# ~+ L7 K! X; x
{1 ?" h" p) ~& B3 c7 {0 I" w* f
extern Word16 *synth; /* Synthesis                */
/ V. j$ [! V* H5 p& C: V9 }8 |Word16 synth_buf[L_FRAME+M];' h! r9 A4 B3 m! G! B/ B# W9 u
Word16 parm[PRM_SIZE+1];          /* Synthesis parameters       */
$ {% S$ i+ s) w& k9 IWord16 Az_dec[MP1*2], *ptr_Az;    /* Decoded Az for post-filter */
3 ~& j$ D) g( T1 c5 `2 Z) h0 eWord16 T2;                         /* Pitch lag for 2 subframes */* Y5 `. `9 I! l1 l4 u& q  J
Word16 i;
, _& j! ^. x+ |3 |Word16 voicing = 60;
4 ]$ `7 a& {( @3 Q5 L( eWord16 pst_out[L_FRAME];          /* Postfilter output          */) v2 {9 n; [9 W5 |# J$ |
Word16 sf_voic;                   /* voicing for subframe       */
+ C; ]7 |7 X" i) avoicing = 60;! L  R) Z* }. ]1 K4 H/ |3 {) {
bits2prm_ld8k( serial, &parm[1]);2 V$ h% k3 p3 Y) }1 l/ x# x
parm[0] = 0;
3 ]( G9 w1 L# a" _4 p
# c6 q3 `0 R' O* X8 [ parm[4] = 0;//Check_Parity_Pitch(parm[3], parm[4]);& H2 E& ^5 [+ y4 k  d
Decod_ld8k(parm, voicing, synth, Az_dec, &T2);
  d& S$ E% |, J# ^1 p* @0 b//--------------------------------------------------
; x2 K& m0 E: hvoicing = 0;
) g- r5 _3 h: o' bptr_Az = Az_dec;
( V4 z) g; H2 i; Tfor(i=0; i<L_FRAME; i+=L_SUBFR) {
, E0 ]5 s( q! A$ a4 C8 Q: F Post(T2, &synth, ptr_Az, &speech, &sf_voic);
3 U3 y6 |8 f7 v4 J3 A5 |, K if (sf_voic != 0) { voicing = sf_voic;}
( ^7 E. b& g. R( x6 O/ ]" u ptr_Az += MP1;8 u1 x; O0 k9 Y+ o$ E# K
}
# r* T  y( H1 Z+ I; `* q0 LCopy(&synth_buf[L_FRAME], &synth_buf[0], M);
2 z" E) Z4 a6 i7 \6 |" Z* U//---------------------------------------------------
  Y4 s2 A6 `+ E* e4 T Post_Process(speech, L_FRAME);
0 j, ^8 t) Y7 S* E}  S% B' A! E: m" D- F* h8 r

. h7 Q+ b8 O1 i2 W4 I/ Y0 Q8 U

		自动登录	找回密码
密码			注册

g729a修正与lib编译

浏览过的版块