Skip to content

Latest commit

 

History

History
142 lines (84 loc) · 5.6 KB

实验结果.md

File metadata and controls

142 lines (84 loc) · 5.6 KB

实验结果记录

暂不考虑:形状向量化后为负、网络的复杂修改(修改激活函数)

主要内容:记录各个实验的结果

本阶段

LSTM基础预测模型 2020年3月21日18点

  1. 绝对位置:通过绝对位置的输入和输出,可以获得大致位置的预测结果,相对位置的处理过于复杂,所以决定只考虑绝对位置,只是在预测更小规模的时候,更大的缩放训练效果有一定损失

  2. 与数目的关系:在数目较少时,比如2个形状时,比较简单的网络即可获得准确的位置(93%),随着形状的增加,精准度下降

  3. 与网络复杂度关系:在8个形状输入,两层的情况下,256/128/56网络最高73%左右,256/256/256网络可以达到76%,网络复杂度增加可以增加预测准确度,但是继续增加网络复杂度256(0.25)/256(0.25)/256(0.25)/256(0.25)四层+DropOut最高仍未76%,可能需要更改激活函数处理

  4. 强化学习:数据规模增加后,获得解所最优解需要的计算时间很长(获得5000个8个形状的BLF花了三个小时),所以采用DRL深度强化学习理论上会比人工获得最优解更好

结论:LSTM可以通过绝对位置的训练预测相对位置,与Pointer结合理论上可以实现预测大致位置,可以通过修改层数和激活函数获得不同的结果,具体需要后续逐步测试

Pointer的基础预测模型

使用Keras 2020年3月21日

准确度很低(<30%),出现过拟合,效果不佳

Pointer+DRL

  • 矩形 rec1000

  • 矩形 等腰三角形 直角三角形 直角梯形 fu1000_val

  • 覆盖3~4个顶点 fu1500, fu900_val

  • 覆盖3~8个顶点 oct10000

task_name|training_dataset (size)|val_dataset (size)|num|width|batch_size|epochs :-: | :-: | :-: | :-: | :-: | :-: 0330|rec1000 (1000)|rec1000_val (1000)|10|1000|32|300 0405|fu1500 (1500)|fu1500_val (900)|10|800|32|168 0407|fu1500 (1500)|fu1500_val (900)|10|800|32|301 0412|fu1500 (1500)|fu1000_val (500)|10|760|32|140 0414|fu1500 (1500)|fu1000_val (500)|10|760|4|148 0416|fu1500 (1500)|fu1000_val (500)|10|760|4|79 0418|oct10000 (3336/10000)|fu1000_val (500)|10|760|16|123 0421|reg3515 (3515)|reg812_val (812)|10|760|16|392 0423|reg2379 (2379)|reg817_val (817)|12|760|16|238 0425|reg2379 (2379)|reg817_val (817)|12|760|16|402 0427|reg2379 (2379)|fu486_val (486)|12|760|16|402 0428|reg2379 (2379)|fu486_val (486)|12|760|16|499 0429|reg2379 (2379)|fu486_val (486)|12|760|8|402

0404: 形状面积差距过大,效果不明显,改进生成算法 0407: BLF改为水平排列,训练集与测试集采用相同形状生成算法,高度均可降低7%,收敛稳定 0409: 输入由xy改为vector 0412: 训练集高度降低5%,测试集效果很差,没有明显趋势 0414: 训练集同上,测试集降低10%(峰值降低12%),60-100轮之后过拟合 0416: reward改为与GA的差值,测试集降低7%,50轮之后逐渐过拟合 0418: reward改回高度,训练集总量10000,每轮从中抽取3338,效果很差 0419: 数据集为40%特殊,40%正多边形,20%不规则多边形,降低5%后收敛 0420: 0419在fu数据集的检验 0421: 0419归一化为[0,1],学习速率迭代幅度为10000步,其他参数不变,降低11%,350轮后收敛 0423: 数据集为40%特殊,30%正多边形,30%不规则多边形,归一化为[-1,1],学习率1e-3/0.95/3,降低6% 0425: 初始模型为0423/200,学习率5e-4/0.96/6,较随机降低9% 0427: 初始模型同上,学习率2e-4/0.96/20,较随机降低8% 0428: 接着0427训练,学习率1e-4/0.96/50 0429: 接着0428训练,学习率1e-4/0.96/100

====================

排样算法记录

  • Bottom Left Fill

  • SA/GA + BLF:效果有限,速度在10个样片内还可以,但是结果不一定OK

  • Layout:需要尽快落实Cuckoo和Fast Neighborhood Search需要实现,其他看情况

  • Collision Free/Exact Fit:需要尽快落实,后续与Pointer+DRL相结合

下一阶段:网络与算法

Pointer混合网络建立

任务:实现Pointer+DRL的网络建立

目标:为后续时实验做基础,如果混合网络可以运行,那么用Cuckoo Search训练网络测试

Pointer+DRL基础模型

任务:强化学习+Pointer预测序列的落实,建立该网络

目标:测试基础的强化学习+排样的,后续再进一步与Exact Fit/Collision Free合并实验

Exact Fit/Collision Free

任务:实现该排样算法(大概*8个形状)

Cuckoo Search

任务:完整实现并测试效果,测试清楚在不同参数的情况下,效果怎么样(大概*8个形状)

下下阶段:开始准备Benchmark

LSTM在不同Width情况下的预测

任务:处理Width与形状的比例差异,比如有些小形状放在大的Container中,一行可以放10个,有些一行只可以放四个

目标:确保其在混合网络上课恶性

LSTM形状推广预测结果

任务:将其推广到Blaz等数据结果,可能会出现因为形状生成产生的问题

目标:确保后续推广到其他形状可行

Pointer+DRL与Exact Fit合并

任务:测试合并后的效果,基本就可以开始写论文了

混合网络

任务:看情况,可能可以和强化学习结合?

下下下阶段:完整实现实验

Pointer+DRL实验

任务:不同宽度、不同数据集大小、推广到benchmark

混合网络实验

任务:看情况

其他

LSTM在扩大形状情况下预测

任务:训练网络10个形状,是否能够应用到20个形状的预测?具体如何操作