花了一个晚上又做了一些改动,性能又有明显提高
(2011-03-25 22:25:55)
标签:
杂谈 |
如下:
#define dolaf3(x,y,z,o,p) "pxor %%xmm1,%%xmm1\npxor
%%xmm2,%%xmm2\npxor %%xmm3,%%xmm3\npxor %%xmm4,%%xmm4\nmovhpd
"#x"(%1),%%xmm1\npsllq $32,%%xmm1\nmovhpd "#y"(%1)
,%%xmm2\npsllq
,%%xmm15\nORPD
#define laf3(x) dolaf3(x*4,128+x*4,256+x*4,384+x*4,1)
void PACK1(uint32_t* code,uint32_t* data,size_t n)
{

加载中…