低解像度でのmandel_chkルーチンの動作が問題ないのでメッシュを256×256にしてみました。
結果はメモリ上に256*256*8bit=64kbyteのバッファを用意して蓄えておき計算完了後にシリアルを通してホストPCに返すようにしてあります。PC上でヘッダ、適当なパレットテーブルと連結してイメージファイルにして表示させます。ここはi386ボードの時用意したツールをそのまま使えるようにI/Fをそろえておきました。
ただし描画範囲のパラメータ入力は10進文字列→浮動小数点バイナリ変換(atof)がアセンブラでは面倒なのでボード側ファームに埋め込みになっています、この全体像の計算時間だけで約6分でした。・・・i386ボードでは60分となっていたので相当速いのですが計算打ち切り回数NMAXの条件が違っていたのかもしれません
この処理中、ほとんどFPU命令だけが実行されていて大活躍のためかFPUがチンチンに熱くなるのです。気休めですがヒートシンクを乗っけておきました。