对gpt类的需求应该怎么测试?

问题

前提:我司现在有个小需求,对接了chatGPT。具体内容是给固定的prompt传了不到10个参数,然后将返回的markdown格式的答案在前台展示。
问题
1、这种需求应该怎么测试呢?

  • 我现在测试的方法是review开发的代码,确认下全部的参数是否正确;
  • 对代码进行打印,确认每次请求chatGPT时,请求的内容确实是对的;
  • 然后chatGPT返回的具体内容,也就是看看有没有返回,其他就没关注了;

2、后续还会有类似midjunior这种,用户上传照片后,给用户展示跟照片差不多的卡通形象,这种又该怎么测试呢?

对于卡通形象生成的逻辑,编写单元测试来验证生成的卡通形象是否准确。您可以提供一些测试用例,包括不同类型的照片(人物、动物等),以确保生成卡通形象的质量和准确性