试题组卷有没有啥好的算法？

比方说一个试卷，总共60题,每道题都由难度、章节、类型3个属性
按照难度简单20题一般30题困难10题
按照章节章节一 10题章节二15题章节3 20题，章节四15题
按照类型文字题20题图片题20题视频题20题

每种维度题目数量是可以自行设置的，保证总题量等于60就行

不是每个最细分类（我这里称sku把）都有题目或者说有足量的题目，这种情况要考虑到

然后随机从数据库中取出这些题，有没有比较好的算法？

——————-分割线———————
一开始考虑的太理想，想保证每种题型选到的概率统一，且每个题目选到的概率统一，这样考虑就只能暴力算法列举出所有情况，再随机了，然而即使是这种3x3暴力算法，全部可能就有C(60,20)xC(40,10)xC(60,10)xC(50,15)xC(60,20)xC(40,20),（随便算一个数都有10^10+，总共6个数乘起来，想想就恐怖），然后这个里面还有很多重复的情况需要去重，估计给定现在最强的计算器都要算不了
那么现在只能考虑去掉每个题目选到的概率统一这个条件了，参考楼下的一些回复，可以想到的是分成3块，每种给定60个这种类型的题目进行随机，最后计算出来的组合，判断数据库是否存在足够的题目，否则就再进行随机，直到得到题目，这种算法在题目种类，每种充足且很多的时，很好用，但是很明显现实情况不可能会这么完美，缺题情况还是特别多的，比方说，一本书前面几章一般都没啥困难的题，全是理论的章节，肯定也不可能有视频题。这种情况下真正能组合起来的只占全部组合的很小一部分，这样就会出现随机很长很长时间才会命中一个的情况。
所以只能抛弃掉所有理想条件，回到先保证题目能组上这个出发点了，即把所有sku类型及其数目，全部列出，每次随机一种题目，算到60题，然后再比较所有属性和题目中给定的是否符合，如果不符合，就再进行循环，这种方法可以很大程度上提升命中概率（当然可能会存在一些极端情况导致组不了题），但是相对而言，每个题目选到的概率就不是很均匀，一些能保证组上卷的”关键题”，会经常出现在组的每套试卷里。
目前为了保证组题效率，只能考虑在第三种方案上改进（当然如果各位有更好的方案，还请不吝赐教），我能想到的是，每次随机完题目后，计算一下各种类型的组题进度，然后下一次再选题的时候，只选择当前组题进度最慢的那一些类题目进行随机，以增强当前组题的命中率，有点动态规划的意味，不知道各位还有啥高见？

组卷

$tmp = []; for ($i=1;$i<=60;$i++){ if($i <= 20) $item = ['简单']; if($i <= 50 && $i>20) $item = ['一般']; if($i <= 60 && $i>50) $item = ['困难']; $tmp[] = $item; } shuffle($tmp); foreach ($tmp as $key => &$value){ if($key < 10) array_push($value,'章节一'); if($key < 25 && $key>=10) array_push($value,'章节二'); if($key < 45 && $key>=25) array_push($value,'章节三'); if($key < 60 && $key>=45) array_push($value,'章节四'); } shuffle($tmp); foreach ($tmp as $key => &$value){ if($key < 20) array_push($value,'文字题'); if($key < 40 && $key>=20) array_push($value,'图片题'); if($key < 60 && $key>=40) array_push($value,'视频题'); } dd($tmp);

$origin = [ 'level' => [ ['text' => '简单', 'total' => 20], ['text' => '一般', 'total' => 30], ['text' => '困难', 'total' => 10] ] ]; $data = []; for ($index = 0; $index < 60; $index++) { $item = []; foreach ($origin as $type => $values) { $total = array_sum(array_column($values, 'total')); $random = rand(1, $total); foreach ($values as $key => $value) { if ($random <= $value['total']) { $item[$type] = $value['text']; $origin[$type][$key]['total']--; break; } else { $random -= $value['total']; } } } $data[] = $item; }

讨论数量: 27

kis龍

Laravel 9.x 译者 511 声望

mark

4年前评论

码龍

课程读者 17 声望

根据题目类型章节难度组装成一个redis set 类型的key

$key = 简单_章节1_文字

将题目的id放入set中

redis_cli>sadd $key 1 2 3 4 5....

生成考卷时使用srandmember取出redis中随机id

redis_cli>srandmember $key 20 // 取出简单章节1文字题随机20个题目id

合并id并到数据库中查询

小白一枚有问题请大佬指出

poker_face （楼主）

你没有get到我的意思啊，现在章节1只允许有10道题，你取了20道肯定不行啊，还有题目数量是可以自己设置的，保证每种分类加起来是60就行了

码龍（作者）

@poker_face 这个只是取其中一种类型题目的随机题如果你要取60道题你就分别取出不同key 不同数量题目出来合并id在到数据库根据id查询出所有题目

ononl

233 声望

仅仅对你说的这些，使用随机数就行了。不过这块我觉得更看重数据库设计，设计不好后期查询会比较痛苦。比如需要本周组过卷的题目进行剔除，对易错题相同考点题目加权重等，没有特别固定算法。

能说的详细点么？主要是怎么保证最后题目数量和它的要求是一致的？

win27149

Laravel 9.x 译者 97 声望

Laravel

或者再进一步处理一下

如果某一个sku没有题目或者题目不足的话（这种情况应该是比较常见的，比如一本书前面几章一般都没啥困难的题），好像会比较麻烦,无限循环的话，完全随机，不管循环多少次也没办法确保可以组上卷。。

win27149 （作者）

这个在题目里面没有写出来，要特殊处理一下。而且还会有其他问题，比如第一章可能只有文字类型的，等等

@win27149 特殊处理应该做不到把？这个随机性太强了如果每个维度都有缺的话

这种方法是每一个sku都可能会选到，如果不能保证每个sku题目数量都够，这个方法就不适用。

有一个想法，用这算法跑一个计划任务，把所有成功的结果缓存起来，然后去重。题库更新之后更新一下缓存

@win27149 最近题目入库了，试了下，缺题类型很多的时候，这个算法命中率很低，跑满7核cpu 一分钟也就能命中5次的样子

renxiaotu

377 声望

先按每种题目都足量处理，不够再从有多出的类型抽取补齐不就行了

你补齐怎么确保插入后各题目数量一致呢？，所以说如果你只有一个sku缺的话，比如说缺AGZ这种情况如果你引入了BGZ，那么一定会导致A属性的题目不够，只有当AGZ和BMY同时缺相同数量的情况下，才能交换AB和GM 达成AMZ和BGY

Siam

98 声望

array_fill填充数组，array_rand取，如果数字大的话不想生成大数组耗内存可以使用数字的大小比较来进行定位

你这个和上面一层方法类似啊，具体讨论在上面，这种方法最大的问题就是题目类型不足的时候，命中率很低

Siam （作者）

@poker_face 那这不是你的业务问题么，怎么会想到先随机出题目组成试卷再用这些凭空组装的题目反找数据库真实数据的？都说了会不够那肯定是按照你真实数据来组装啊。。

@Siam 一开始只是接到需求，都没碰到实际的题目，导致了自己测试数据都是随机生成的，考虑过缺的情况，把数据弄的少一点，结果随机地缺就导致这样缺的很“均匀”，最多试一千次，肯定也命中了，就没出现过这样的问题。没想到实际入库的题目缺的离谱，直接这个算法就跑不动了

liziyu

课程读者 117 声望

以前弄过简单的，先手动组装试卷，然后再以试卷为单位，随机抽试卷的方式来弄。

如果只有3种类型每种3个小分类，最多也就27种，手动组卷倒也难度不大，关键这只是我举的一个例子，实际操作大概是5种类型，总共可能的sku有180种,然后题目有80题

laravel_denghy

课程读者 74 声望

组卷不应该是一次性的，先按难度和章节筛选出题目列表，告诉用户各个题型有多少道题，用户可以把题目加入待选列表，然后变更条件重新筛选，列表需要标注是否已选择，直至满足组卷需求

建议先研究一下题库是怎么做的，一般会有学科、年级、教材版本、知识点、章节、难度、题型等多个维度的

如果你想要模糊条件组合查询选题，用户每做一个选择，你都要将查询当前符合要求的题目数量显示出来，而不是用户都选择完了就直接去计算是否符合需求

laravel_denghy （作者）

题库固定的前提下某个章节某个难度某个题型的题目数量都是固定的

阿超

28 声望

看看 WPS 的稻壳有个试卷中心，可以组卷，参考借鉴一下去哈哈哈

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助

试题组卷有没有啥好的算法？

推荐文章：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

试题组卷有没有啥好的算法？

推荐文章：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

请登录