g729a修正与lib编译

天云上人 · 发表于 2011-6-8 16:07:23

到这里下载:http://xiaokotei.download.csdn.net/user/xiaokotei/all/
下载以后需要修改bits.c文件：
我仔细研究ITUG729代码后发现：
编码器的输出及解码器的输入不是编码生成的参数向量，而是经过1bit->Word16（即2字节）转换的bit流
，从而使得编码器输出数据不是原始PCM的1/16（理论上g.729编码和wav的文件的大小比例约为1:16），而实际上，我们采用他的coder编码出来的文件由于上述“串行化”的原因和原始wav几乎相同大，而且甚至比原始的wav还要大个十几K。

ITU-T为了在标准化方针中进行丢帧隐藏测试，对语音编解码器参考软件的码流格式一般需求为ITU-T G.192中规定的格式，即用16位的0x007F表示1个比特’0’，用0x0081表示1个比特’1’，每个帧头会有同步字和包的长度。对于同步字，0x6B20表示该帧为坏帧，0x6B21表示该帧为好帧。这样固然非常好，不过。。。导致了编码后数据的增大。

那么怎么来解决上述问题呢？解决的方法就是??去掉串行化代码，或重新编写串行化代码。
我们打开bits.c，就能看到里面定义的如下4个函数：
static void int2bin(int value, int no_of_bits, INT16 *bitstream);
static int bin2int(int no_of_bits, INT16 *bitstream);
void prm2bits_ld8k(int prm[], INT16 bits[]) ;
void bits2prm_ld8k(INT16 bits[], int prm[]) ;
这个文件就是编码后文件大小没有什么变化的关键所在了，能用如下的代码替换：
static void bit2byte(Word16 para,int bitlen,unsigned char * bits,int bitpos) ;
static Word16 byte2bit(int bitlen,unsigned char * bits,int bitpos) ;

void prm2bits_ld8k(Word16 *para,unsigned char *bits)
{
int i;
int bitpos = 0;
for (i = 0;i

void bit2byte(Word16 para,int bitlen,unsigned char * bits,int bitpos)
{
int i;
int bit = 0;
unsigned char newbyte = 0;

unsigned char *p = bits + (bitpos / 8);
for (i = 0 ;i > (bitlen - i -1) ) &0x01;
newbyte = (1
bitpos++;
if (bitpos % 8 == 0)
p++;
}
}

void bits2prm_ld8k(unsigned char *bits,Word16 *para)
{
int i;
int bitpos = 0;
for (i = 0;i

Word16 byte2bit(int bitlen,unsigned char * bits,int bitpos)
{
int i;
int bit = 0;
Word16 newbyte = 0;
Word16 value = 0;

unsigned char *p = bits + (bitpos / 8);
for (i = 0 ;i > (7 - bitpos % 8)) &0x01;
if (bit == 1) {
newbyte = (1
return value;
}
通过上述的修改，已能确保，每次一帧160个字节的pcm16音频数据流，能编码成为22个字节的编码参数prm，经过改写过的prm2bits_ld8k处理后，会转换成为10个字节的最终语音编码数据，这个时候，才真正体现出g.729a的威力。

编码器的代码能采用如下的修改方法
(1)修改coder.c：
unsigned char serial[SERIAL_SIZE]; /* 输出数据的数据类型由Word16改为unsigned char */
(2)修改coder.c文件，对编码器调用方式进行修改（关键部分代码）：
frame =0;
while( fread(new_speech, sizeof(Word16), L_FRAME, f_speech) == L_FRAME)
{
printf("Frame =%d＼r", frame++);
Pre_Process(new_speech, L_FRAME);
Coder_ld8a(prm);
prm2bits_ld8k( prm, serial);
fwrite(serial, 1, SERIAL_SIZE, f_serial);
}
return (0);

(3)把ld8a.h头文件中关于“串行化”长度的常量定义修改为10个字节：
#define SERIAL_SIZE 10

(4)解码器decoder.c进行类似的修改（关键部分代码）：
frame = 0;
while( fread(serial, 1, SERIAL_SIZE, f_serial) == SERIAL_SIZE)
{
printf("Frame =%d＼r", frame++);
bits2prm_ld8k(serial, &parm[1]); /* 注意这里一定要是&parm[1] */
parm[0] = 0; /* 假设没有丢帧 */
parm[4] = 0 ; /* 假设数据效验正常 */
Decod_ld8a(parm, synth, Az_dec, T2);
Post_Filter(synth, Az_dec, T2);
Post_Process(synth, L_FRAME);
fwrite(synth, sizeof(short), L_FRAME, f_syn);
}
return (0) ;
通过上面的修改，标准的ITU-T的G.729语音编码器和解码器就基本能达到1:16的编码效率了。

修改bits2prm_ld8k和prm2bits_ld8k之后的编码的数据其实也不是1/16的，因为编码器中的比特分配并不是均匀的，有的时候一个参数需要用5bit来表示，不过他并不是在内存中用5bit表示，而是用了一个word16来表示的。所以这样编码后得到的数据还是要比1/16大一些，原理上来讲，编完码后的prm[]大小应该是11（共11个参数），不过编码器的bits2prm()在其前面又加了一位校验是否丢包的校验位，这样1个block编码后的prm[0]这位实际上是个校验位。你要注意一下，解码器在读取编码后文件内容的时候，不是直接读取的字节，而是通过一个函数read_frame()，进行读取的，一个block读取prm[]大小为12。这样如果你把bits2prm去掉，编码后一个block用11个word16表示，不过解码的时候一次读取12个，这样就错了。所以需要对解码器作一下相应的修改，使他不再去关注那个prm[0]，一次读入11个数据。你看一下解码函数也会发现，在读入12个prm后，开头就是这么一句：bfi = *prm++，你把这个bfi作为参数传入函数，使其不再通过prm[0]得到，应该就能了。
封lib：
va_g729.h
#define L_FRAME_COMPRESSED 10
#define L_FRAME          80
#ifdef __cplusplus
extern "C" {
#endif
void va_g729a_init_encoder();
void va_g729a_encoder(short *speech, unsigned char *bitstream);
void va_g729a_init_decoder();
void va_g729a_decoder(unsigned char *bitstream, short *synth_short, int bfi);
#ifdef __cplusplus
}
#endif
va_g729.c
#include <stdio.h>
#include <stdlib.h>
#include "typedef.h"
#include "ld8k.h"
Word16 bad_lsf;
void va_g729a_init_encoder()
{
Init_Pre_Process();
Init_Coder_ld8k();
}
void va_g729a_encoder(short* SpeechBuf,unsigned char * serial)
{
extern Word16 *new_speech;    /* Pointer to new speech data          */
Word16 prm[PRM_SIZE];          /* Analysis parameters.             */
Word16 i;
Word16 syn[L_FRAME];
for(i=0;i<L_FRAME;i++)
{
new_speech = SpeechBuf;7 o( r6 k% x; n) z0 p
}
& M3 D8 U2 e# q0 q" S% S; Z6 l    for(i=0; i<PRM_SIZE; i++) prm = (Word16)0; 7 a1 v' H8 S$ M5 J/ h1 `* f
Pre_Process(new_speech, L_FRAME);6 C1 K2 m" R' L% {" R. l7 U* \0 y
Coder_ld8k(prm,syn);
' R  `6 N/ l. Q prm2bits_ld8k( prm, serial);
+ X# Y/ z( z# t- \5 b# k4 W4 |$ o}6 s5 Y; v# h" g9 f! r. `" |0 E+ U
void va_g729a_init_decoder()' c+ l* B' P- T4 q6 J: q* I4 `* v
{5 n. t! A, _; [. g3 [8 t3 F2 ~
extern Word16 *synth;
- q* a' `- x, _3 h1 s. G  `( |& T bad_lsf = 0;       /* Initialize bad LSF indicator */
/ z" ?% a3 t; j  f7 I% l$ l Init_Decod_ld8k();
1 M; h( R- {2 ~+ ?* j Init_Post_Filter();
- R1 @+ R0 _% u5 v Init_Post_Process();/ Z7 a/ Z; Y" s" ?2 p" _
}: p# m) J! e/ x+ Z1 |+ w2 }
void va_g729a_decoder(unsigned char *serial, short *speech, int bfi)4 N8 @; I/ O: n9 k& H; O+ B
{# \& g8 Z/ F2 `% U+ o
extern Word16 *synth; /* Synthesis                */
0 Q. ?" ?5 X6 w' U" n9 iWord16 synth_buf[L_FRAME+M];0 X4 a# V$ g4 @+ @5 [3 x) ^
Word16 parm[PRM_SIZE+1];          /* Synthesis parameters       */
  Q% K1 b9 K8 l8 q. w9 Z  YWord16 Az_dec[MP1*2], *ptr_Az;    /* Decoded Az for post-filter */
8 {+ C9 `  N: {# @" N5 \" o$ ^Word16 T2;                         /* Pitch lag for 2 subframes */* j3 X/ q; _  x" K+ E1 U2 g* O
Word16 i;! s0 a, ^2 r/ p6 v! E3 O
Word16 voicing = 60;
) t2 {8 B. d% E6 e7 W& k2 FWord16 pst_out[L_FRAME];          /* Postfilter output          */
/ P% t0 N3 m; L3 `1 VWord16 sf_voic;                   /* voicing for subframe       */7 U  z% d, t+ S$ Q; M/ p
voicing = 60;
$ J# n; ?  ~# T# { bits2prm_ld8k( serial, &parm[1]);
* N& t: U; a! p& A2 J parm[0] = 0;
  M5 j5 O! d5 F1 N  t9 x' u4 i# I       $ q% r/ K, A! C
parm[4] = 0;//Check_Parity_Pitch(parm[3], parm[4]);5 S4 Y% V% \" Y7 j, J" s( z: ]8 @
Decod_ld8k(parm, voicing, synth, Az_dec, &T2);
- n6 W  Z8 F# t0 c: i* K//--------------------------------------------------; [( j# f3 e- }1 V7 w
voicing = 0;
! l' _1 j4 u) t* C' {; {ptr_Az = Az_dec;& w  f  w6 i& s9 W
for(i=0; i<L_FRAME; i+=L_SUBFR) {, u2 k- m" V$ y
Post(T2, &synth, ptr_Az, &speech, &sf_voic);# O* D1 ?0 h$ R4 G
if (sf_voic != 0) { voicing = sf_voic;}
6 W- X9 e+ ^. Z+ H2 b' q ptr_Az += MP1;7 M6 O) j# [; E: d' h( _
}) ]. Y  a8 d& }& Y; L% j3 n$ Y
Copy(&synth_buf[L_FRAME], &synth_buf[0], M);
- M- m: r( [3 ]1 q//---------------------------------------------------
) C$ p7 `/ ^6 v* y: I Post_Process(speech, L_FRAME); ! S* r4 i+ m7 x6 p
}) j/ i" W6 f) l' T8 r7 g2 G
1 L9 F7 e4 C) R7 w# @3 O& x

		自动登录	找回密码
密码			注册

g729a修正与lib编译

浏览过的版块