class_list = "花盆,苹果,裙子,树,电话,皇冠,企鹅,冰激凌,汉堡包,蘑菇,伞,挂锁,吉他,耳机,椅子,蛋糕,车,熊猫,南瓜,足球,篮子,鸭子,玫瑰花,松鼠,草莓,气球,凤梨,轮胎,鞋,闹钟,鱼,马,太阳花,包,铲土机,房子,乌龟,树袋熊,宇航员,瓶子,瓢虫,鸟,枕头,帽子,鸭子,大象,帐篷,蝴蝶,杯子,兔子"
把所有的图片都枚举出来, 建立数据训练集 ,
title_img = base64.b64decode(data['title']) content_img = base64.b64decode(data['content']) content_img = np.frombuffer(content_img, np.uint8) # 解码成 OpenCV 图像格式 content_img = cv2.imdecode(content_img, cv2.IMREAD_COLOR) result = paddleocr_ocr.ocr(title_img, det=False, cls=False)[0][0][0] result = result.replace('拖动滑块出现完整的', '').replace('施动滑块出现完整的', '').replace('后就松开',
利用python库 OpenCV 对图像处理并识别
预处理数据, 图片和坐标数据集, 准备喂给Ai模型
请出百度飞桨PaddlePaddle 深度学习平台
pip install paddlepaddle
计算出问题 比如一个椅子, 还有目标图片中的各个图片位置坐标和类型
最后做成web接口, 对外提供给客户端使用
客户端传入 滑块url地址 ,请求POST接口, 成功得到 目标图片滑块X轴距离值
。。。。。
接下来就要结合安卓开发了, 这边采用的模拟滑动方案, 用到了谷歌无障碍服务accessabllity ,
可提供测试服务 !