Мне кажется ты не совсем понимаешь, о чём говоришь.
Окей, возьмёшь ты FFI, только это будет медленнее, потому что FFI придётся кастить луа типы к сишным + тебе нужно будет в разы больше кода, что бы это реализовать. Разница ФПС будет в районе 0.5 кадров.
Повторюсь, контур без шейдеров ты никак не сделаешь. Можешь, конечно, компилировать шейдер в вставлять его в pipeline видеокарты, но это уже слишком нагромождено будет, легче просто квадратная обводка