現在我有一套含有SSE指令集的代碼,現在想把SSE指令的部分換成NEON指令,想實現相同的功能,但是我對這兩個指令集都不太懂,然後一堆指令看到我都暈了,所以希望大神們可以教教我這兩個指令之間的相似性和不同,或者怎麼學習這兩種指令集,好讓我能改這套代碼,感激不盡!
直接翻譯指令代碼是移植了,可是性能沒有移植過去。因為不同架構各自優化的方法和策略不同。
你的思路是看懂sse代碼,寫出偽c的算法代碼,然後再優化對應平台的機器代碼。前一個步驟也可以由ida pro這個軟件代勞,當然產生的代碼僅僅是個參考。arm的優化需要看對應的書或者手冊。