[求助]如何用定制指令实现数组输入输出？

指令, 定制, 输出, 求助, 输入

Nios II 的 custom instruction 只能有两个32位输入端和一个32为输出端。相应生成的宏也只能有两个32位数输入输出。但是我现在有一个C函数的输入要求是32位数的数组（至少包含两个以上32位数）。请问如何实现将这种函数转化为custom instruction？谢谢

[此贴子已经被作者于2007-5-9 21:37:28编辑过]

收藏分享评分

回复引用

订阅 TOP

注册会员

Rank: 2

UID: 149027
性别: 男

2^#

phoeix发表于 2007-5-10 20:58 | 显示全部帖子

急啊，有人帮忙吗？

回复引用

TOP

注册会员

Rank: 2

UID: 149027
性别: 男

3^#

phoeix发表于 2007-5-11 19:46 | 显示全部帖子

谢谢版主的回复[em07] 其实这个tutorial 我都已经看过了，这个leading zero的例子我也试过了，不过我现在的问题是一个定制指令只能有两个32位输入和一个32位输出。leading zero只有一个输入是没问题，但是我要转换的函数有至少6个32位数输入和2个32位数输出。请问这个问题如何解决呢？

回复引用

TOP

注册会员

Rank: 2

UID: 149027
性别: 男

4^#

phoeix发表于 2007-5-14 18:40 | 显示全部帖子

第一种分解的方法我也想过，但是如果只是输入输出还好办，可是我在CI里面还要同时对那6个输入进行逻辑操作。而这种操作不可能被分解到几个CI里面去。所以基本上不太可行。

我还听过一种方法是顺序读入6个输入，也就是用一个CI读三遍，直到收到6个输入后才开始逻辑操作。但这就需要CI能暂时存储读入的数据直到操作结束。听说读写internal register file可以实现这个目的。但是目前为止我还没能解决这个问题。而且这种方法的执行效率也比较低，输入的数目越多，浪费的运行时间也越多。

版主说的第二种方法我也听过，应该就是hardware acceleration了吧。这种方法也是硬件加速，不过不像CI只能2in1out，它处理可以多入多出的操作，一般来说如果函数执行时间不多于2－3个clock cycle就用CI，多于这个数目就推荐用这个方法了。而且现在altera提供了 nio C2H可以自动生成代码，还是很方便的。我就正准备试试这个方法。（就是那个C2H软件好像很贵很贵的，^_^）

回复引用

TOP