找回密码
 立即注册
搜索

拍张照片求解数独,计算机如何看懂题目,这个GitHub项目告诉你


晓查 发自 凹非寺
量子位 报道 | 公众号 QbitAI

现在只需拍张照片,就能快速解决数独问题了。

数独对计算机来说不是什么难事,但就是这样一个“平平无奇”的项目却登上了GitHub今日的热榜。

这个登上热榜的项目,名字就叫AI Sudoku,其实就是用AI里的计算机视觉,把照片变成计算机能看懂的网格和数字。



接下来求解数独问题当然不难。重要的是,在这个过程中,我们也学习到了一些常用的计算机图片处理算法。
拍张照片解数独


智能数独求解器(Smart Sudoku Solver)的安装使用并不复杂,只需把项目代码克隆到本地即可。

Windows系统下支持图形化界面,把拍摄图片传输到电脑上就能给出答案。

首次运行需要连接网络下载MNIST数据集,训练模型并创建knn.sav文件,整个过程可能需要5~10分钟,之后就可以离线运行了。
python Run.py
运行上面的代码后,将显示KNN算法的训练结果



之后将很快出现GUI界面,选择上传你拍摄的数独谜题图片。



一直点击下一步,就能得到这道题的答案:



原理


作者在程序中提供了卷积神经网络k近邻两种算法,供你选择。

运行应用程序之前,只需将Run.py文件中的modeltype变量设置为“CNN”或“KNN”。默认情况下,程序设置为“ KNN”,而且现阶段使用KNN可以获得更高的准确性。
'''Run this file to run the application'''from MainUI import MainUIfrom CNN import CNNfrom KNN import KNNimport os# Change the model type variable value to "CNN" to use the Convolutional Neural Network# Change the model type variable value to "KNN" to use the K Nearest Neighbours Classifiermodeltype = "KNN"
在我们点击“下一步”的过程中,程序展示了图片处理的步骤。

首先是对图片进行高斯模糊处理,去除噪声和其他细节。



接下来,生成一张清晰的扫描图。由于一张图片中不同区域的光照,采用自适应高斯阈值的方法可以避免这一问题:



反转图片,让文字和网格都变成白色,背景变成黑色。



之后找出边缘的四条线,通过这四条线,将拍到的数独题目变成一张正方形图片。



最后将图片切割成81个小块,识别出每个小块里的数字。
传送门


求解数独问题并不是很难,这个开源项目的作用其实是帮你了解图像识别和处理的各种算法,例如高斯模糊自适应高斯阈值等等。

项目对这些算法的名称和介绍都做了适当的加粗处理,如果你对这些感兴趣,不妨前去观摩学习一下。

源代码地址:
https://github.com/neeru1207/AI_Sudoku

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

大神点评9

转发了
回复

使用道具 举报

a88843055 2025-1-26 10:32:06 显示全部楼层
转发了
回复

使用道具 举报

网络太糟糕,下载knn.sav的时候 由于连接方在一段时间后没有正确答复或连接的主机没有反应,连接尝试失败。[捂脸]
回复

使用道具 举报

abahyw 2025-1-26 10:34:06 显示全部楼层
转发了
回复

使用道具 举报

wanxiaoeryi 2025-1-26 10:34:22 显示全部楼层
转发了
回复

使用道具 举报

薇薇 2025-1-26 10:34:57 显示全部楼层
转发了
回复

使用道具 举报

近夸 2025-1-27 10:53:46 显示全部楼层
在撸一遍。。。
回复

使用道具 举报

a-ka 2025-1-28 16:29:32 显示全部楼层
愣着干嘛,鼓掌啊
回复

使用道具 举报

0行云0 2025-1-29 08:24:24 显示全部楼层
不错 支持下
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies