用遗传算法实现K-means聚类算法的K值选择

用遗传算法实现K-means聚类算法的K值选择

一、使用遗传算法实现K-means聚类算法的K值选择(论文文献综述)

孙肖坤[1](2021)在《复杂大型建设项目费用偏差控制方法及信息系统设计》文中进行了进一步梳理随着全球范围内经济形势的动态稳定发展,复杂大型建设项目在国内外均呈持续增长的态势,国际工程项目市场的竞争愈发激烈。复杂大型建设项目事关民生和经济效益,其开发建设会对国家和社会产生广泛而深远的影响。在工程建设领域,许多投资主体拥有雄厚的资金实力和丰富的开发建设经验,并开始涉足复杂大型建设项目的开发建设,项目投资规模越来越大,建设周期越来越长,参与建设的单位越来越多,不确定性带来的项目风险也愈发复杂。随着时代的发展,复杂大型建设项目逐渐成为项目管理领域的研究热点。然而,在项目建设过程中,投资效率低下、费用超支等现象屡见不鲜,项目执行情况在各层面上不尽如人意,传统的项目管理理论已经不能适应现阶段管理实践的需求。因此,从复杂性视角出发对项目管理领域进行研究就成为一种新的解决思路。如何对项目复杂性进行科学、系统以及深入的分析,如何在项目建设过程中动态、全面地掌握项目费用状态,如何判断工程费用实际状态与计划的偏差严重程度,如何对项目费用偏差做出科学的警报和预测,如何有依据地对工程项目的费用偏差进行有效纠偏控制,就成为摆在管理者面前的一个理论和实践问题。为了更加科学有效地针对复杂大型建设项目费用实施监控管理,本文运用系统动力学相关理论和方法,建立了基于复杂性视角的建设项目费用偏差影响因素的系统动力学模型,构建了项目费用偏差的警报及预测模型,梳理了项目全生命周期不同费用偏差程度下的纠偏流程,进而分析并设计了以理论模型为基础的复杂大型建设项目费用偏差控制信息系统。具体研究内容包括以下四个部分:(1)基于系统动力学的费用偏差关键影响因素识别研究。首先,对复杂大型建设项目的费用监控模式进行概述;在此基础上,对系统动力学相关基础理论及其应用在建设项目费用偏差控制领域的可行性进行分析;然后,将复杂大型建设项目作为一个整体系统,对项目建设各阶段内费用偏差影响因素之间的关系进行分析识别,构建系统动力学反馈图模型,确定主要变量,内生变量、外生变量,建立各变量之间方程关系;最后,通过Vensim软件模拟仿真,建立动态控制模型并验证其可行性和有效性,识别出费用偏差关键影响因素及其影响程度,并对模拟结果进行分析。(2)复杂大型建设项目费用偏差警报及预测模型研究。首先对复杂大型建设项目不同阶段费用偏差计算的需求及特点进行分析,据此选取适用于复杂大型建设项目费用偏差警报的方法模型;然后对K-Means聚类算法进行缺陷分析,引入贴近度概念,并将边界均值算子作为主要方法对经典K-means聚类进行改进,有效克服了主观随意性和警情区间不连续的问题;最后通过算例分析证实了本模型的有效性。复杂大型建设项目费用偏差预测模型是偏差警报模型的后续研究。首先,全面论述了神经网络模型的相关原理,对其在复杂大型建设项目费用偏差预测研究中的可行性和适用性进行了分析;然后,利用仿生算法对传统BP神经网络进行改进,优化神经网络模型中的初始网络权值和阈值,并将历史数据输入模型中进行训练获得成熟模型;同时,将现阶段的费用偏差进行子目费用分析,将总偏差最终分摊至每一个子目费用的扰动因素,深度分析复杂大型建设项目中不同活动对费用偏差的影响,在当前费用偏差情况已知的情况下,研究其对未来费用偏差的影响程度并予以量化,判定即将发生的项目警情及其位置,有效辅助项目费用管理方采取措施进行处理,实现真正意义上的项目费用事前控制。(3)复杂大型建设项目费用偏差控制策略及效果评价研究。首先,针对复杂大型建设项目费用偏差控制策略,挖掘了流程再造和协同理论与之相适应的契合点,梳理了费用偏差控制中流程再造和协同的目标和原则;其次,针对复杂大型建设项目在前期决策阶段、中期实施阶段、后期运维阶段所面临的不同费用偏差警情,明确各阶段责任方,梳理并总结出具体的纠偏操作流程和控制策略;为了增强该纠偏流程的适用性,本节首次提出了纠偏效果评价,从控制能力、控制效果、经济和社会效果等角度构建指标体系,构建了基于支撑度理论的模糊群决策模型,对纠偏效果进行评价,给出反馈结果,推动纠偏策略的持续改进。(4)复杂大型建设项目费用偏差控制系统设计研究。把研究的理论和构建的模型拓展到实际的项目费用管理中,提出了复杂大型建设项目费用偏差控制信息系统设计。首先,对复杂大型建设项目费用偏差控制系统进行了定义,对系统建设目标、系统用户和系统需求进行分析,确定了系统的非功能需求和功能需求;然后构建费用偏差控制系统的总体设计框架结构,从系统开发方法、系统开发平台、系统功能模块、系统数据库四个角度对系统进行详细深入的设计;在涉及到系统关键的实施技术方面,对开发技术选型进行了结构性论述,并对数据仓库的核心设计理念进行了详细介绍,设计了系统模型管理模块的结构和重点功能。该系统包括费用偏差警报、费用偏差预测、费用偏差控制、纠偏效果评价等功能。

宋晓东[2](2021)在《医药配送中心货到人拣选机器人多拣选台任务分配研究》文中研究指明目前,医药流通行业受到国家医药改革相关政策的影响,面临着在医药终端下单至送货到位的有限时间内,医药物流中心如何完成大量拆零订单的拣选作业,即如何提高拣选效率的困境。通过在实际中的应用,基于搬运机器人的“货到人”拣选系统已被证明是解决拆零拣选困境的重要手段之一。本文主要针对基于搬运机器人的“货到人”拣选系统中的订单问题进行研究,主要研究内容如下:首先针对基于搬运机器人的“货到人”拣选系统中,搬运通道有限所导致订单拣选问题,设计了基于波次订单的分批算法:针对波次运算后的分批订单,构建了以机器人搬运货架出入库次数为目标函数,完成了波次订单分批数学模型,针对分批结果的聚类程度设计了基于k-means算法的细分批算法,实现订单分批的合理聚类。其次对医药物流中心中的“货到人”拣选系统往往是多拣选台的场景,为了规避在药品的批次管理约束情况下传统订单分配策略带来的拣选台之间的订单耦合问题,对“货到人”拣选系统的订单分配问题进行了分析,建立了订单分配问题的数学模型,以最小化订单拣选完成时间为目标,求得较优的货箱到达顺序。为解决标准遗传算法在求解具有较大规模订单量的系统时易陷入局部最优解的问题,提出基于邻域搜索的自适应遗传算法。相比于标准遗传算法,改进遗传算法做出了两点优化:1.采用自适应交叉和变异概率,避免破坏优秀子代;2.在变异操作之后加入邻域搜索,以提高算法的局部搜索能力,避免算法过早收敛。最后,为了验证模型和算法的有效性与可靠性,通过MATLAB对算法进行仿真,实验结果证明本文提出的分批算法效果远强于传统FCFS算法。在订单分配算法方面,在解的优劣性方面,自适应遗传算法优于标准遗传算法;在算法运行时间方面,标准遗传算法优于自适应遗传算法。本文主要对基于搬运机器人的“货到人”拣选系统中多拣选台的订单问题进行研究,在国药等项目进行了部分实验验证,相关模型和算法可以为医药流通行业的实际应用提供一些参考,并为后续相关研究指明方向。

姜珍妮[3](2021)在《基于耦合DNA-GA-P系统的聚类分析研究》文中研究表明依据生物体中细胞器和细胞膜的工作原理,P系统可按照极大并行模式运行,其计算能力等价于图灵机,当前已经被学者们用于处理数据挖掘问题。DNA遗传算法(DNA Genetic Algorithm,简称DNA-GA)模拟生物的遗传信息表达机制,该类信息表达过程同样发生在真核生物的细胞中,所以本文我们将P系统与DNA遗传算法进行有效耦合,既可以保留P系统的分布式并行计算能力又可以融合DNA遗传算法丰富的对象表达机制和基因级操作,可以扩展P系统计算模型的对象及规则表达方式,为现有的P系统提供新的动态演化模式,进一步拓宽P系统能处理的问题。在移动数据爆炸式增长的今天,传统的数据处理方式已经不能满足海量数据处理的需求,数据挖掘由此而生,其中聚类分析是数据挖掘领域的一项重要研究内容,作为一种可以处理数据并从数据中提取可用知识的有效手段,其重要性在模式挖掘、图像处理等领域得到广泛认可。但当前的聚类方法自身都存在一些不足之处,我们除了可以改进算法本身外,还可以借助其他优化方法对聚类方法做进一步优化。因此可以在聚类方法中结合新的优化算法,融入新的计算模型,以便进一步优化聚类效果。新方法和新模型的研究是数据挖掘领域的重要课题。本文的主要研究内容如下:(1)构建耦合DNA-GA-P系统基于P系统以及DNA遗传算法的生物学知识,构建新型的耦合DNA-GA-P系统。同时基于耦合DNA-GA-P系统,提出四种扩展的耦合DNA-GA-P系统,分别是:具有定向交流与概率进化规则的耦合DNA-GA类细胞P系统,具有膜分裂/膜溶解规则的耦合DNA-GA类组织P系统,基于链式拓扑结构的耦合DNAGA-P系统以及基于自组装思想的耦合DNA-GA种群P系统。并对提出的P系统进行了收敛性分析和系统分析。(2)对四种常用聚类算法进行改进,分别将四种耦合DNA-GA-P系统用于实现改进之后的聚类算法,具体有:a)提出了基于耦合DNA-GA类细胞P系统的模糊C均值聚类算法基于权重均值的距离计算方式被用于计算模糊C均值聚类算法(Fuzzy Cmeans clustering algorithm,简称FCM)的目标函数。新型的耦合DNA-GA类细胞P系统被用于实现聚类过程,利用耦合DNA-GA-P系统的全局搜索能力和跳出局部最优的能力进一步优化改进算法,使用了UCI数据集对改进的算法进行了性能验证。b)基于耦合DNA-GA类组织P系统的密度峰值聚类算法基于K近邻(K-Nearest Neighbor,简称KNN)和香农熵的计算方法被用于计算数据点的密度矩阵。耦合DNA-GA类组织P系统被用于实现聚类过程。新的类组织P系统能够在提高算法效率的同时还降低算法的复杂性。最终,在人工数据集和UCI数据集上分别进行了实验验证。c)基于耦合DNA-GA链式P系统的集成模糊K-modes算法基于直觉模糊集(Intuitionistic fuzzy set,IFS)和核技巧,均衡地解决模糊Kmodes算法所有属性问题,提高算法对噪声的鲁棒性。然后将改进之后的模糊Kmodes算法与另外两种K-modes算法作为基聚类算法,综合三个算法的各自优势,对模糊K-modes算法做一致性聚类。耦合DNA-GA链式P系统被用于实现提出的集成聚类算法,以防止聚类算法陷入局部最优,同时实现隐式并行的聚类过程。d)基于耦合DNA-GA种群P系统的多视图谱聚类算法提出一种新的基于KNN和图思想的自动加权多视图一致性聚类算法。一方面,在初始化数据表示矩阵(相似度矩阵)的过程中使用K近邻思想。另一方面,采用相似度矩阵而不是原始数据对象来学习一致性矩阵。相似度矩阵将在迭代过程中不断更新。然后,在一致性矩阵生成过程中,为了考虑不同视图的不同贡献,系统自动为各个视图生成权重,并在后期更新过程中同步更新每个视图的权重信息。最后,当一致图收敛时,对一致图执行谱聚类算法,并得到最终的多视图聚类结果。将这个多视图谱聚类过程按照具体规则要求在耦合DNA-GA的种群P系统中完成,系统的极大并行性可进一步提高算法的运行效率。(3)将提出的基于耦合DNA-GA-P类细胞P系统的模糊C均值聚类算法和基于耦合DNA-GA种群P系统的多视图谱聚类算法分别用于图像分割和文本聚类中。综上所述,本文主要提出了一种新型的耦合DNA-GA-P系统,并基于系统定义,结合P系统中的进化交流、膜分裂膜溶解、链式拓扑结构以及自组装思想的基本概念,扩展了四种耦合DNA-GA-P系统,同时分别将四种系统用于四种改进的聚类算法中,最后将其中两种基于耦合DNA-GA-P系统的聚类算法分别用于图像分割和文本聚类的实际应用中。

邢晓雨[4](2021)在《基于客流时空特征聚类分析的地铁列车运营时刻表优化研究》文中指出十三五期间我国城市轨道交通高速发展,投入轨道交通建设的资金高达26278.7亿元,年均完成建设投资5255.7亿元,相比十二五期间翻了一倍,2020年底我国地铁制式占比城市轨道交通运营制式约80%。地铁列车运营时刻表是地铁运营行车组织的核心要素,制定科学合理的运营时刻表对于提高乘客的运载效率、乘客乘车满意度以及提升企业运营服务水平和降低列车运营及人力成本具有重要意义。本文根据京港地铁14号线东段的工作日客流、非工作日客流以及各车站客流的实际数据,采用k-means聚类算法进行聚类分析客流的时间分布规律与空间分布规律。研究常用的列车运行图编制方法及理论,综合考虑线路客流、通信、信号设备等方面实际情况,构建了基于动态客流分析的地铁列车运营时刻表优化研究模型,通过分析模型特点选取粒子群算法并对算法参数进行自适应改进,增加求解效率和求解精度。最后将时空客流聚类成果代入优化模型,通过Matlab数学规划软件输出优化结果:工作日地铁列车运营时刻表总成本降低3.4%;非工作日地铁列车运营时刻表总成本降低11.7%。本文主要工作如下:(1)根据地铁客流的形成、地铁客流影响因素以及地铁客流分布特征,针对北京市地铁客流进行全面分析,研究地铁客流的时间特征和空间特征,为后续客流聚类分析和列车运营时刻表优化调整提供理论支持。(2)以乘客出行成本与运营企业运营成本总和最小化为目标展开具体分析,构建地铁列车运营时刻表优化模型,并根据模型求解复杂程度选取自适应粒子群算法,针对实际情况设置粒子群算法的基本参数。(3)应用地铁客流时间和空间聚类分析成果结合地铁列车运营时刻表优化模型,输入京港地铁14号线东段客流数据、列车数据及时刻表数据,运用自适应粒子群算法对其求解,输出最优工作日列车运营时刻表和最优非工作日列车运营时刻表,分析可知,本文的运营时刻表优化模型对降低乘客和企业双方的成本具有良好的效果,经实例验证优化模型能够降低成本,具有一定的实际意义和参考价值。

王俊逸[5](2020)在《配电网拓扑校验及中低压配电网电压控制策略研究》文中认为随着智能量测设备的不断发展,电力公司可以获取配电网终端用户的实时信息。低压配电网也可以通过智能电表获取用户数据。与此同时,城市配电网电缆比率提高,逐步形成了电缆与架空线共存的网络架构,形成中低压一体化配电网。此外,为了提高清洁能源的利用率,电力系统允许并鼓励大量光伏系统(Photovoltaic,PV)接入配电网,其运行也由被动向主动转变。然而,配电网中的功率分布和电压质量关乎配电网能否安全、稳定运行。传统的无功电压控制设备与可控PV、负荷、储能等协调配合,实现最优潮流分布。更加主动的应对PV并网带来的电压问题,减小PV随机性与波动性的影响,降低配电网的网损。本文在此背景下研究低压配电网拓扑校验以及中低压一体化电压控制策略。针对低压配电网地理信息系统中存在的拓扑连接错误问题,本文提出了一种基于电压量测数据和K-means聚类的低压配电网拓扑校验算法。针对PV并网带来的电压问题,利用灵敏度的方法研究了分布式电源注入功率对节点电压和网损的影响。推导电压灵敏度以及网损灵敏度公式。提出基于灵敏度分析的中低压一体化电压控制策略。针对光伏出力的不确定性与波动性问题,提出了一种多时间尺度的就地—集中控制策略。集中控制以模糊理论处理功率的不确定性,以自适应权重自动调节目标函数的权重。就地控制根据光伏和负荷的功率调整光伏下垂控制斜率,并利用电压灵敏度确定下垂控制参数实现低压配电网网损优化,解决短时间内功率波动引起的低压配电网电压越限。通过仿真验证,结合改进K-means聚类的拓扑校验算法能准确获取聚类数K,将待校验台区用户聚类,进而识别出拓扑连接错误的用户。基于灵敏度的中低压一体化电压控制策略能以灵敏度将传统的多目标优化转化两阶段的单目标优化,实现电压控制与网损优化。集中-就地控制策略能有效应对功率的不确定性,实现中低压配电网协调优化。

张敏[6](2020)在《中铁快运物流总包运输方案编制关键技术研究》文中进行了进一步梳理在当前经济发展形势下,生产加工型企业为快速响应客户个性化的供货要求,同时降低运营成本,倾向于将物流需求外包给第三方物流企业,与此同时,对物流企业的服务效率与质量提出了更高要求。中铁快运作为我国铁路运输的主要力量,在激烈的市场竞争环境下,必须充分发挥铁路运输运量大、成本低、安全可靠的优势,积极发展多式联运,不断提高运输效率和服务质量,为用户提供一体化、个性化服务,才能赢得更多市场机会。目前,中铁快运基于“干线运输+仓储+区域配送”的理念,推出了以铁路运输为主、公路运输为辅的多式联运物流总包业务,为生产加工型企业提供一体化的综合物流解决方案。但现有方案设计主要集中在干线运输组织方面,在两端的接取、配送等方面缺乏有效的方案支撑,难以提供给客户整体方案和运输时效保证。同时,在编制物流总包业务运输方案的过程中,主要以人工经验为主,没有形成一套科学、标准、自动的方案编制方法,严重制约了企业发展。针对以上问题,本文就中铁快运物流总包运输方案编制问题进行了深入研究,主要包括以下几方面的内容:(1)分析了物流总包运输的特点,在此基础上将物流总包运输方案编制问题拆分成物流网络规划问题和可行径路搜索两个关键问题,提出了物流总包运输方案的编制思路。(2)在分析集运车站、疏运车站和仓库间的覆盖关系的基础上,建立了以物流网络总费用最小为目标,单指派下的基于集合覆盖问题的物流网络规划模型。(3)构建了物流总包中行包车站评价指标体系,利用主成分分析-聚类两阶段方法确定了行包车站发展等级划分方案,利用k-means聚类方法确定了行包车站区域划分方案,给出了集运车站、疏运车站和仓库的备选集生成方法。(4)设计了遗传算法对提出的物流网络规划模型进行求解,并利用贪婪思想和遍历算法验证了算法的有效性,基于疏运车站、仓库的配送半径和固定成本进行了敏感性分析。(5)在构建行包运输服务网络的基础上,给出了基于A*算法的站间可行径路搜索算法,并通过算例分析验证了网络规划模型和路径搜索算法的有效性。

毛润康[7](2020)在《欠定条件下基于遗传算法的供水管网水力模型校核及应用研究》文中研究说明供水管网为人们的日常生活、生产及消防提供用水,是城市生命线工程的重要组成部分。供水管网水力模型的构建与应用是实现供水管网现代化管理、设计规划、优化调度和风险预测的必要手段与途径。在构建的管网水力模型中,由于节点流量与管道阻力系数无法直接测量,需要通过实测的水压与流量数据进行校核,在监测点不足的欠定条件下,如何有效校核水力模型并提高校核效率是管网研究领域的难点与热点问题。基于此,本文展开研究,并取得了如下几方面的研究成果与结论:(1)基于现有研究成果,总结了城市供水管网水力模型的构建及校核研究。首先,介绍了水力模型构建及校核的研究进展、实现步骤和理论研究;其次,对供水管网水力模型的校核依据及标准进行了归纳和分析;最后,详细介绍了作为本文核心算法的遗传算法。(2)提出了基于遗传算法的需水乘子校核法,并将多次优化解的平均值作为需水乘子最终解以求解欠定优化问题。该方法将每个节点的需水乘子作为校核目标,并将基于遗传算法多次优化的平均值作为最终解。相较于传统方法,此方法校核后的水压和管道流量平均误差分别降低了75.82%、37.3%,其优点是无需对节点进行复杂地分组,校核结果能充分体现出各节点的用水差异性,并且多次校核的平均值大大提高了欠定条件下遗传算法校核结果的稳定性和唯一性,降低了不合理解对校核结果的影响,为供水管网的欠定校核提供了一种可行的方法。(3)构建了供水管网水力模型并用于校核研究。供水管网水力模型是由节点、管道、水泵、阀门、蓄水池和水塔这六类基本系统组件组成。常说的建模指的是将实际工程问题按照水力学基本理论转换为数学问题建立方程组进行求解的过程。本部分对比分析了目前常用的几款建模软件,并结合本课题的需要,最终选用EPANET进行丽江市永胜县供水管网水力模型构建,并且对该水力模型进行校核,校核后的各节点水压平均误差均小于0.5m,符合校核要求。同时验证了本文所提校核方法在实际供水管网中的可行性与普遍实用性。(4)开展了永胜县供水管网水力模型的应用研究。一方面,通过校核完成的水力模型模拟永胜县供水管网现运行工况,模拟后该管网有90%以上的用水节点水压超过0.50MPa,62.9%的管段流速低于经济流速,通过分析并找出管网中存在的问题及隐患。另一方面,考虑到水压监测点的布置与水力模型的校核是相互依赖的,合理的监测位置提供的数据能使水力模型的校核精度更高,精度较高的水力模型能使得监测点优化布置更合理。本文提出了基于K-means聚类法的水压监测点优化布置方法,并对校核后的永胜县供水管网进行优化布置,旨在为该供水管网的后续校核研究提供可行的监测点布置方案。文中所有提出的算法都在Matlab中编写了相应程序,并利用相应的管网水力模型验证了算法的正确性与可行性。

尹力[8](2020)在《基于多目标遗传算法的聚类方法研究》文中研究说明聚类作为机器学习中的一种无监督学习方法,是从数据中理解和学习结构信息的重要途径。原型聚类方法是使用最广泛的聚类算法之一,在图像分割、文本分析、基因分析和社交网络等领域都有大量的应用。但它主要有两个缺陷,一是需要事先知道聚类的个数,但聚类簇的数量通常不是预先可知的。二是算法对初始聚类中心敏感,导致聚类结果不稳定。将遗传算法引入聚类中的方法有巨大的潜力解决上述缺陷。本论文深入研究了基于多目标遗传算法的聚类方法,探讨了多目标方法相对于单目标方法的优势,并提出了一种新的聚类方法NSGAII-GR(Non-dominated Sorting Genetic Algorithm-II using Gene Rearrangement)。NSGAII-GR纯粹以目标函数为指导,通过进化算法产生代表聚类划分的个体并进行筛选,使它们尽可能在目标函数上表现最优。该方法能够自适应地确定聚类簇的数量,并取得稳定良好的聚类结果。本文主要进行了以下几个方面的研究:1.研究了基于多目标遗传算法的聚类模型框架,根据该框架实现了一个基于多目标遗传算法的原型聚类方法。它不需要预先指定聚类簇数,也能得到良好的聚类结果。并且与单目标方法相比,该多目标方法有相对更好的性能。2.探讨了算法中目标函数选择的问题,提出把广义样本方差和用作一个目标函数,把Calinski-Harabasz指数用作另一个目标函数。可以将解集中的聚类簇数的范围控制在更合理的范围,使得算法更容易取得正确的聚类簇数。然后,设计了一个第二阶段选择算子,让算法能够在不需要任何先验信息的情况下确定最佳聚类簇数,并从数量不确定的解集中选择出三个推荐解作为输出。3.对前述方法,对于基于多目标遗传算法的聚类方法进行了改进,提出了一种基因重排技术结合簇间融合来加快算法收敛速度,并取得更好的聚类结果。改进的基于多目标遗传算法的聚类方法NSGAII-GR能够在没有任何先验信息的情况下,在多个人工数据集和真实数据集中自适应地确定聚类簇数,并取得良好且稳定的聚类结果。

杨晓君[9](2019)在《K-means聚类算法研究及在股票投资的应用》文中指出聚类算法是数据挖掘算法之一,最常见的聚类算法是K-means聚类算法,但该算法是局部最优算法,只有初始聚类中心选得恰到好处,算法才能达到全局最优。关于K-means聚类算法中初始聚类中心的选择,国内外已有很多改进方法,本文在前人研究的基础上进行研究和探讨,研究工作主要有:(1)提出了一种新的选择初始聚类中心的K-means聚类算法,主要是将k-dist值与最近邻法结合来确定初始聚类中心。经实验验证,发现新算法的聚类效果比传统的K-means聚类算法更好,体现在Sil指数更大,类内数据的距离平方和更小。(2)将新算法应用于股票投资中,研究结果表明改进后的新算法可以将股票更有效地分类。

苏宏阳[10](2019)在《基于用户投资风格的证券智能推荐方法研究》文中指出随着投资者群体以及金融市场信息规模的不断扩大,传统的以提供金融数据为核心的互联网金融平台已经无法满足各类投资者的信息需求,这使得互联网金融平台逐渐从以提供金融数据信息为核心转化成以提供金融服务为核心。证券推荐作为一种投资建议服务可以辅助投资者做出更好的投资决策。因此在证券投资领域起到越来越重要的作用。目前的证券推荐系统存在系统资源耗费严重、难以进行实时性在线推荐、推荐的证券适应性差、质量不高等问题,为解决上述缺点,本文以证券推荐系统的受众群体——投资者为主要研究对象进行投资者风格画像建模、投资者群体关系挖掘以及智能证券推荐建模工作,开展了基于用户投资风格的智能证券推荐研究。针对当前证券系统无法准确获取投资者重要特征的局限性,提出了基于用户投资分析的投资风格画像建模方法。采用传统的业绩归因理论对投资者投资数据以及市场数据进行结合,并从投资能力以及投资偏好两个角度建立更加完备的投资者风格描述特征。根据特征描述设计对应的投资者风格画像,建立特征的时效性指标来验证画像描述的稳定性,并通过系统实现与平台应用验证建模方法的有效性与可行性。传统证券推荐系统无法动态捕捉用户的兴趣偏移状态,严重影响到证券推荐结果对于投资者的适应性,本文利用投资者的风格画像特征,采取群体关系挖掘的方式动态捕捉投资者的投资风格转移情况,提出了优化的遗传聚类群体挖掘模型。对传统群体挖掘聚类模型进行深入调研,并对基础遗传聚类算法的各个遗传组件进行了优化,包括染色体初始化优化、适应度函数设计优化,遗传操作优化等优化策略,基于此设计了投资者群体划分的整体方案,包括系统模块组成、运行逻辑等。根据优化设计方案开展了相关对比实验,证实了所提出的模型相比于传统的群体聚类挖掘方法可以表现出更优异的性能。在完成投资者描述以及捕捉投资者特征偏移后,本文提出了基于投资者投资风格与群体关系的证券推荐模型。深入研究基于奇异值分解(Singular value decomposition)理论的推荐算法后,针对其计算复杂度高,扩展性差的缺陷,提出了结合用户群体划分的推荐方法,采用矩阵降维与群体划分技术降低线上推荐算法的运算复杂度,引入双层SVD机制以及投资者偏好捕捉机制用以提升证券推荐模型的推荐效果,通过推荐准确性预测及推荐证券收益性能指标验证所提出的证券推荐模型可以为投资者提供高质量、个性化的在线证券推荐服务。

二、使用遗传算法实现K-means聚类算法的K值选择(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、使用遗传算法实现K-means聚类算法的K值选择(论文提纲范文)

(1)复杂大型建设项目费用偏差控制方法及信息系统设计(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 研究背景和意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 国内外研究现状
        1.2.1 复杂大型建设项目研究现状
        1.2.2 项目费用控制研究现状
        1.2.3 预警方法研究现状
        1.2.4 纠偏策略研究现状
        1.2.5 信息系统应用研究现状
    1.3 主要研究内容和技术路线
    1.4 主要创新点
第2章 相关基础理论研究
    2.1 复杂大型建设项目特点及费用控制分析
        2.1.1 复杂大型建设项目特点分析
        2.1.2 复杂大型建设项目费用偏差控制参与主体
        2.1.3 复杂大型建设项目费用控制复杂性分析
    2.2 费用偏差控制相关理论研究
        2.2.1 费用偏差控制内涵
        2.2.2 费用偏差影响因素分析
        2.2.3 费用偏差控制基本原则
    2.3 费用偏差控制模型及方法研究
        2.3.1 偏差特征系统动力学理论
        2.3.2 神经网络模型
        2.3.3 费用偏差预警聚类方法
        2.3.4 费用偏差控制策略及评价理论
    2.4 本章小结
第3章 基于系统动力学的费用偏差影响因素识别研究
    3.1 复杂大型建设项目费用监控模式
        3.1.1 费用监控模式特征分析
        3.1.2 费用监控模式构建
        3.1.3 费用监控模式运行流程
    3.2 费用偏差影响因素的系统动力学模型构建
        3.2.1 系统动力学的基本理论
        3.2.2 基于系统动力学的费用偏差控制的可行性分析
        3.2.3 系统动力学模型构建
    3.3 费用偏差影响因素的子系统方程式建立
        3.3.1 系统动力学建模中涉及到的数学方法
        3.3.2 影响因素的子系统方程式建立
    3.4 系统动力学模型仿真和分析
    3.5 本章小结
第4章 基于改进神经网络模型的费用偏差控制方法研究
    4.1 工程建设项目费用偏差计算需求及特点分析
    4.2 基于K-means算法的费用偏差警情计算模型研究
        4.2.1 K-means聚类理论及缺陷分析
        4.2.2 K-means聚类方法改进及适用性研究
        4.2.3 基于改进K-means算法的费用偏差计算模型构建
    4.3 基于改进神经网络模型的费用偏差计算模型研究
        4.3.1 神经网络模型原理分析
        4.3.2 神经网络模型的改进及适用性研究
        4.3.3 基于改进神经网络模型的费用偏差计算模型构建
    4.4 算例分析
    4.5 本章小结
第5章 基于流程再造的费用偏差控制策略及效果评价
    5.1 复杂大型建设项目费用偏差控制中的流程再造与协同
        5.1.1 费用偏差控制中流程再造与协同的目标
        5.1.2 费用偏差控制中流程再造与协同的原则
    5.2 复杂大型建设项目各阶段费用偏差控制策略
        5.2.1 前期决策阶段的费用偏差控制策略
        5.2.2 中期实施阶段的费用偏差控制策略
        5.2.3 后期运维阶段的费用偏差控制策略
    5.3 复杂大型建设项目费用偏差控制效果评价
        5.3.1 费用偏差控制效果评价指标体系
        5.3.2 基于支撑度理论的纠偏控制效果评价群决策模型
        5.3.3 算例分析
    5.4 本章小结
第6章 复杂大型项目费用偏差控制信息系统分析与设计
    6.1 复杂大型建设项目CDMIS分析
        6.1.1 复杂大型建设项目CDMIS的定义
        6.1.2 复杂大型建设项目CDMIS的建设目标
        6.1.3 复杂大型建设项目CDMIS的用户分析
        6.1.4 复杂大型建设项目CDMIS的需求分析
    6.2 复杂大型建设项目CDMIS设计
        6.2.1 系统的总体设计原则及开发方法
        6.2.2 系统的平台整体设计
        6.2.3 复杂大型建设项目CDMIS的功能及模块设计
        6.2.4 复杂大型建设项目CDMIS的数据库设计
    6.3 复杂大型建设项目CDMIS关键技术
        6.3.1 复杂大型建设项目CDMIS的开发技术选型
        6.3.2 复杂大型建设项目CDMIS的数据仓库设计
        6.3.3 复杂大型建设项目CDMIS的模型管理模块设计
    6.4 本章小结
第7章 研究成果和结论
参考文献
附录
攻读博士学位期间发表的论文及其它成果
攻读博士学位期间参加的科研工作
致谢
作者简介

(2)医药配送中心货到人拣选机器人多拣选台任务分配研究(论文提纲范文)

致谢
摘要
ABSTRACT
序言
1 绪论
    1.1 研究背景与意义
    1.2 医药配送中心作业特点
    1.3 医药配送中心订单拣选系统选择
    1.4 国内外研究现状
        1.4.1 订单波次划分问题
        1.4.2 订单分配问题
        1.4.3 任务分配问题
    1.5 课题技术路线
2 相关技术
    2.1 “货到人”拣选系统
        2.1.1 “货到人”拣选系统的分类
        2.1.2 搬运机器人“货到人”拣选系统的工作流程
        2.1.3 搬运机器人“货到人”拣选系统控制系统结构图
        2.1.4 搬运机器人“货到人”拣选系统的特点
        2.1.5 搬运机器人“货到人”拣选系统订单分批的问题分析
    2.2 k-means算法相关理论
        2.2.1 k-means算法基本思想
        2.2.2 k-means算法基本步骤
        2.2.3 k-means算法优缺点
    2.3 本章小结
3 医药配送中心波次订单细分批算法
    3.1 医药配送中心订单细分批问题描述
    3.2 模型建立
        3.2.1 模型假设
        3.2.2 符号说明
        3.2.3 模型数学表达
    3.3 基于k-means的波次订单细分批算法
        3.3.1 距离的度量
        3.3.2 k值的选择
        3.3.3 算法步骤
    3.4 本章小结
4 医药配送中心多拣选台订单分配问题
    4.1 “货到人”拣选系统的多拣选台问题描述
    4.2 订单分配优化模型
    4.3 标准遗传算法求解订单分配优化问题
        4.3.1 编码方式
        4.3.2 初始种群生成
        4.3.3 适应度函数
        4.3.4 选择
        4.3.5 交叉
        4.3.6 变异
        4.3.7 终止条件
    4.4 标准遗传算法求解存在的问题
    4.5 改进的自适应遗传算法
        4.5.1 遗传算子改进
        4.5.2 模拟退火算法
        4.5.3 多种群自适应遗传算法
    4.6 本章小结
5 仿真实验与结果分析
    5.1 项目背景描述
    5.2 基于k-means的波次订单细分批算法仿真分析
        5.2.1 基于k-means的波次订单细分批算法效果仿真分析
        5.2.2 基于k-means的波次订单细分批算法聚类程度约束仿真分析
    5.3 自适应遗传算法仿真分析
        5.3.1 非遗传算法求解
        5.3.2 标准遗传算法
        5.3.3 混合算法
        5.3.4 多种群遗传算法
        5.3.5 算法对比
        5.3.6 任务均衡
    5.4 本章小结
6 结论与展望
    6.1 论文总结
    6.2 论文展望
参考文献
附录A
作者简历及攻读硕士/博士学位期间取得的研究成果
学位论文数据集

(3)基于耦合DNA-GA-P系统的聚类分析研究(论文提纲范文)

摘要
Abstract
符号表示和英文缩写清单
    符号表示目录
    英文缩写目录
第1章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 P系统的研究现状
        1.2.2 DNA遗传算法的研究现状
        1.2.3 聚类分析的研究现状
        1.2.4 基于DNA遗传算法和P系统的聚类问题研究现状
    1.3 理论概述
        1.3.1 DNA遗传算法
        1.3.2 P系统
        1.3.3 聚类分析
    1.4 研究的创新点
    1.5 论文主要研究内容与组织框架
        1.5.1 研究内容
        1.5.2 论文的组织结构
第2章 耦合DNA-GA-P系统(CDP)
    2.1 问题提出
    2.2 耦合DNA-GA-P系统构建
    2.3 四种扩展的耦合DNA-GA-P系统
        2.3.1 具有定向交流与概率进化规则的耦合DNA-GA类细胞P系统(DPCDP)
        2.3.2 带有膜分裂/膜溶解规则的耦合DNA-GA类组织P系统(DDCDP)
        2.3.3 基于链式拓扑结构的耦合DNA-GA-P系统(CHCDP)
        2.3.4 基于自组装思想的耦合DNA-GA种群P系统(SACDP)
    2.4 耦合DNA-GA-P系统的收敛性分析
    2.5 耦合DNA-GA-P系统分析
        2.5.1 DPCDP系统分析
        2.5.2 CHCDP系统分析
第3章 基于DPCDP系统的模糊C均值聚类算法
    3.1 引入权重均值距离的FCM(WMFCM)
        3.1.1 WMFCM算法提出
        3.1.2 实验评价指标
        3.1.3 WMFCM算法性能分析
    3.2 基于DPCDP系统的WMFCM算法实现(WMFCM-DPCDP)
        3.2.1 系统基本框架
        3.2.2 细胞1中的进化规则
        3.2.3 细胞2中的进化规则
        3.2.4 细胞3中的进化规则
        3.2.5 不同细胞之间的交流规则
        3.2.6 迭代停止规则
        3.2.7 算法复杂度分析
    3.3 实验分析
        3.3.1 实验数据集
        3.3.2 实验设置
        3.3.3 实验结果分析
        3.3.4 T假设检验
第4章 基于DDCDP系统的密度峰值聚类算法
    4.1 算法基础
    4.2 引入K近邻和香农熵思想的DPC算法
        4.2.1 当前算法不足
        4.2.2 改进措施
    4.3 基于DDCDP系统的KSDPC算法实现(KSDPC-DDCDP)
        4.3.1 系统基本框架
        4.3.2 系统进化规则
        4.3.3 KSDPC-DDCDP算法流程
        4.3.4 算法复杂度分析
    4.4 实验分析
        4.4.1 实验数据集
        4.4.2 实验设置
        4.4.3 实验结果分析
第5章 基于CHCDP系统的集成模糊K-modes算法
    5.1 算法基础
    5.2 基于核直观权重模糊K-modes算法(KIWFKM)
        5.2.1 KIWFKM算法
        5.2.2 算法复杂度分析
        5.2.3 KIWFKM算法性能分析
    5.3 基于CHCDP系统集成FKM算法实现(CFKM-CHCDP)
        5.3.1 CHCDP系统结构
        5.3.2 反应链式-超图子系统
        5.3.3 局部交流P系统
        5.3.4 一致性子系统
    5.4 实验分析
        5.4.1 实验数据集
        5.4.2 实验设置
        5.4.3 实验分析
        5.4.4 T假设检验
第6章 基于SACDP系统的自权重多视图谱聚类(KGWMC-SACDP)
    6.1 算法基础
    6.2 SACDP系统基本框架
    6.3 基于KNN和图结构的自权重多视图集成谱聚类
        6.3.1 目标函数
        6.3.2 迭代进化算法
    6.4 KGWMC-SACDP算法分析
        6.4.1 聚类实现
        6.4.2 复杂性分析
        6.4.3 收敛性分析
    6.5 实验分析
        6.5.1 实验数据集
        6.5.2 实验设置
        6.5.3 实验结果分析
        6.5.4 T假设检验
第7章 耦合算法在两类实际问题中的应用研究
    7.1 耦合WMFCM-DPCDP算法在图像分割中的应用
        7.1.1 图像分割问题
        7.1.2 基于聚类分析的图像分割技术
        7.1.3 实验对比与分析
    7.2 耦合KGWMC-SACDP算法在文本聚类中的应用
        7.2.1 文本聚类方法
        7.2.2 实验数据集
        7.2.3 实验对比与分析
第8章 结论与展望
    8.1 结论
    8.2 进一步的研究工作
参考文献
攻读博士学位期间论文成果
攻读博士学位期间项目成果
攻读博士学位期间获奖成果
致谢

(4)基于客流时空特征聚类分析的地铁列车运营时刻表优化研究(论文提纲范文)

致谢
摘要
ABSTRACT
1 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 动态客流分析研究现状
        1.2.2 地铁列车运营时刻表编制研究现状
    1.3 论文主要内容
        1.3.1 主要研究内容及技术路线
        1.3.2 研究重点
2 地铁客流分析
    2.1 地铁客流的形成
    2.2 地铁客流影响因素
        2.2.1 社会宏观因素
        2.2.2 交通线网布局规划与运营管理因素
        2.2.3 重大活动、节假日和天气状况等因素
    2.3 地铁客流分布特征
        2.3.1 时间分布特征
        2.3.2 空间分布特征
    2.4 本章小结
3 基于时空特征的地铁客流聚类分析
    3.1 京港地铁14号线东段客流特征
        3.1.1 时间特征
        3.1.2 空间特征
    3.2 基于k-means的地铁客流特征聚类分析
        3.2.1 k-means聚类算法介绍
        3.2.2 运营时间段聚类分析
        3.2.3 车站聚类分析
    3.3 本章小结
4 地铁列车运营时刻表优化分析研究
    4.1 地铁列车运营时刻表概述
        4.1.1 地铁列车运营时刻表要素
        4.1.2 地铁列车运营时刻表数学描述
    4.2 符号变量及假设条件
        4.2.1 符号变量
        4.2.2 假设条件
    4.3 地铁列车运营时刻表优化数学模型建立
        4.3.1 乘客出行成本
        4.3.2 地铁运营企业成本
        4.3.3 目标函数
        4.3.4 约束条件
    4.4 基于自适应粒子群算法的地铁列车运营时刻表优化
        4.4.1 粒子群算法概述
        4.4.2 地铁列车运营时刻表优化的自适应粒子群算法求解步骤
    4.5 本章小结
5 京港地铁14号线东段运营时刻表优化实例分析
    5.1 京港地铁14号线东段概述
        5.1.1 京港地铁14号线东段线路图
        5.1.2 列车概述
        5.1.3 运营模式概述
    5.2 自适应粒子群算法(APSO)的列车运营时刻表优化流程
        5.2.1 列车运营时刻表优化流程设计
        5.2.2 算法参数设置
        5.2.3 工作日仿真分析
        5.2.4 非工作日仿真分析
    5.3 本章小结
6 结论与展望
    6.1 主要结论
    6.2 展望
参考文献
作者简历及攻读硕士学位期间取得的研究成果
学位论文数据集

(5)配电网拓扑校验及中低压配电网电压控制策略研究(论文提纲范文)

摘要
Abstract
变量注释表
1 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
    1.3 本文主要工作
2 基于K-means聚类的低压配电网拓扑校验方法
    2.1 拓扑校验原理
    2.2 K-means聚类算法
    2.3 拓扑校验模型
    2.4 算例分析
    2.5 本章小结
3 基于灵敏度分析的中低压一体化配电网电压控制策略
    3.1 光伏系统对配电网电压的影响
    3.2 算例分析
    3.3 灵敏度推导
    3.4 电压控制模型
    3.5 算例分析
    3.6 本章小结
4 考虑不确定性的中低压配电网集中-就地电压控制策略
    4.1 模糊潮流理论
    4.2 典型光伏就地控制策略
    4.3 集中-就地控制策略
    4.4 算例分析
    4.5 本章小结
5 总结与展望
参考文献
附录1 24小时内权重及优化前后各目标函数
作者简历
致谢
学位论文数据集

(6)中铁快运物流总包运输方案编制关键技术研究(论文提纲范文)

致谢
摘要
ABSTRACT
1.引言
    1.1 研究背景与意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 国内外研究现状
        1.2.1 国内外研究现状
        1.2.2 现有研究总结
    1.3 研究内容与技术路线
        1.3.1 研究内容
        1.3.2 技术路线
2 物流总包运输方案编制问题分析
    2.1 物流总包业务分析
    2.2 物流总包运输特点
    2.3 物流总包运输方案编制思路
    2.4 本章小结
3 基于集合覆盖问题的物流网络规划模型
    3.1 业务描述
    3.2 拟解决的方案
        3.2.1 构建思路
        3.2.2 影响因素分析
    3.3 集合覆盖问题
    3.4 模型构建
        3.4.1 问题描述
        3.4.2 模型假设
        3.4.3 模型构建
    3.5 本章小结
4 行包车站的分级评价与备选集的确定
    4.1 物流总包中行包车站评价指标体系的建立
        4.1.1 标准层指标的确定
        4.1.2 评价因子的选择
        4.1.3 数据收集和整理
    4.2 主成分分析-聚类两阶段评价方法
        4.2.1 主成分分析法
        4.2.2 系统聚类
    4.3 行包车站发展等级划分方案
        4.3.1 主成分分析法筛选原始指标
        4.3.2 聚类分析得出划分方案
    4.4 行包车站区域划分方案
        4.4.1 k-means聚类算法
        4.4.2 行包车站区域划分方案的确定
    4.5 本章小结
5 基于遗传算法的模型求解
    5.1 求解方法
        5.1.1 遗传算法概述
        5.1.2 遗传算法步骤
        5.1.3 遗传算法设计
    5.2 数据整理
    5.3 模型运算与分析
        5.3.1 模型运算
        5.3.2 算法验证
        5.3.3 敏感度分析
    5.4 本章小结
6 基于A~*算法的站间可行径路搜索
    6.1 可行径路分析
        6.1.1 行包运输服务网络
        6.1.2 可行径路
    6.2 径路搜索算法
        6.2.1 A~*算法简介
        6.2.2 算法设计
        6.2.3 算法流程
    6.3 算例
    6.4 本章小结
7 结论与展望
    7.1 本文主要工作
    7.2 研究展望
参考文献
附录 A 物流总包中行包车站评价基础数据
作者简历及攻读硕士学位期间取得的研究成果
学位论文数据集

(7)欠定条件下基于遗传算法的供水管网水力模型校核及应用研究(论文提纲范文)

摘要
Abstract
第一章 绪论
    1.1 选题背景及意义
    1.2 供水管网水力模型研究现状
        1.2.1 水力模型研究进展
        1.2.2 水力模型参数校核研究进展
        1.2.3 监测点优化布置的研究进展
        1.2.4 管网水力模型校核面临的主要问题
    1.3 本文研究内容、技术路线与创新点
        1.3.1 研究内容
        1.3.2 技术路线
        1.3.3 主要创新点
第二章 供水管网水力模型及其校核研究
    2.1 供水管网水力模型概述
        2.1.1 管网水力模型的理论基础
        2.1.2 管网水力模型的构建理论
    2.2 供水管网水力模型校核概述
        2.2.1 供水管网水力模型校核理论基础
        2.2.2 校核依据及标准
        2.2.3 遗传算法概述
    2.3 本章小结
第三章 欠定条件下供水管网校核研究
    3.1 欠定问题的研究现状
    3.2 欠定条件下校核方法研究
        3.2.1 节点流量的聚合
        3.2.2 基于遗传算法的需水乘子校核
    3.3 案例分析
    3.4 本章小结
第四章 永胜县供水管网水力模型的构建与校核
    4.1 永胜县县情概要
        4.1.1 区位概要
        4.1.2 供水现状
    4.2 永胜县供水管网水力模型建立
    4.3 水力模型校核
    4.4 本章小结
第五章 永胜县供水管网水力模型的应用
    5.1 永胜县现状运行工况分析
        5.1.1 供水管网压力分布
        5.1.2 流速分布
    5.2 水压监测点的优化布置
        5.2.1 水压监测点位置对校核精度的影响
        5.2.2 节点水压敏感度矩阵计算
        5.2.3 K-means聚类法
        5.2.4 水压监测点优化结果
    5.3 本章小结
第六章 结论与展望
    6.1 主要工作与结论
    6.2 展望
致谢
参考文献
附录
    A.攻读硕士学位期间发表的学术论文与参与的科研项目
    B.基于遗传算法的需水乘子校核代码
    C.基于K-means聚类法的水压监测点优化代码
    D.永胜县水压监测点优化数据

(8)基于多目标遗传算法的聚类方法研究(论文提纲范文)

摘要
abstract
第1章 引言
    1.1 研究背景与意义
    1.2 国内外研究现状
        1.2.1 基于遗传算法的聚类方法研究现状
        1.2.2 基于多目标遗传算法的聚类方法研究现状
    1.3 论文组织结构
第2章 聚类算法概述
    2.1 聚类的基本概念
    2.2 聚类有效性评价指标
        2.2.1 聚类内部评价指标
        2.2.2 聚类外部评价指标
    2.3 遗传算法与聚类
    2.4 本章小结
第3章 一种基于多目标遗传算法的聚类方法
    3.1 引言
    3.2 多目标遗传算法
    3.3 基于多目标遗传算法的聚类方法基本框架
        3.3.1 编码方式
        3.3.2 重组算子
        3.3.3 适应度函数
        3.3.4 选择算子
    3.4 基于多目标遗传算法的聚类方法实现
        3.4.1 种群初始化
        3.4.2 变长交叉操作
        3.4.3 变异操作
        3.4.4 适应度值计算
        3.4.5 选择操作
    3.5 多目标方法与单目标方法对比实验
        3.5.1 实验环境与实验数据集
        3.5.2 基于单目标遗传算法的聚类方法
        3.5.3 聚类有效性指标对比实验
    3.6 本章小结
第4章 引入广义样本方差和基因重排的多目标遗传算法聚类
    4.1 基于多目标遗传算法的聚类方法中的缺陷
    4.2 改进设计的基于多目标遗传算法的聚类方法
        4.2.1 引入广义样本方差
        4.2.2 基因重排技术和簇间融合
        4.2.3 染色体长度变异
        4.2.4 非法染色体检查
        4.2.5 第二阶段选择算子
    4.3 引入广义样本方差和基因重排技术的基于多目标遗传算法聚类的实现
        4.3.1 改进的基于多目标遗传算法聚类方法流程
        4.3.2 改进基于多目标遗传算法聚类具体实现
        4.3.3 算法时间复杂度
    4.4 实验结果分析
        4.4.1 实验数据
        4.4.2 自适应确定聚类簇数实验结果与分析
        4.4.3 聚类外部评价指标对比实验结果分析
    4.5 本章小结
第5章 结束语
    5.1 主要工作与创新点
    5.2 后续研究工作
参考文献
致谢
攻读硕士学位期间从事的科研工作及取得的成果

(9)K-means聚类算法研究及在股票投资的应用(论文提纲范文)

中文摘要
英文摘要
1 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状综述
    1.3 研究目的
    1.4 研究内容
    1.5 本文结构
2 预备知识
    2.1 聚类分析算法
        2.1.1 聚类算法的基本理论
        2.1.2 主要聚类分析方法
        2.1.3 聚类有效性评价
    2.2 K-means聚类算法
        2.2.1 算法思想
        2.2.2 算法流程
        2.2.3 实验模拟与结果分析
        2.2.4 优缺点与改进思路
    2.3 因子分析
    2.4 本章小结
3 基于密度的K-means聚类中心的选择优化算法
    3.1 k-dist图
    3.2 DK图
    3.3 基于k-dist值选择初始中心的K-means聚类算法
        3.3.1 算法思想
        3.3.2 算法流程
    3.4 改进基于k-dist值选择初始中心的K-means聚类算法
        3.4.1 算法思想
        3.4.2 算法流程
    3.5 实验模拟与结果分析
    3.6 本章小结
4 改进算法在股票投资中的应用
    4.1 数据样本
        4.1.1 原始数据
        4.1.2 数据处理
    4.2 聚类分析
    4.3 本章小结
5 结论和展望
    5.1 结论
    5.2 展望
参考文献
附录
    A 关于家电行业的42只股票聚类结果
    B 学位论文数据集
致谢

(10)基于用户投资风格的证券智能推荐方法研究(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 课题研究目的及意义
    1.2 国内外相关技术研究现状
        1.2.1 用户行为分析研究现状
        1.2.2 用户画像研究现状
        1.2.3 聚类技术研究研究现状
        1.2.4 推荐算法研究现状
    1.3 本文的主要研究内容
第2章 基于投资行为分析的用户投资风格画像建立
    2.1 引言
    2.2 基于投资者业绩归因理论的投资行为分析建模
        2.2.1 传统业绩归因模型理论研究与分析
        2.2.2 基于传统业绩归因模型的MSI业绩归因模型构建
        2.2.3 基于MSI业绩归因模型的用户投资行为分析建模
    2.3 用户标签体系的构建以及用户投资风格画像建模
        2.3.1 基于用户投资行为分析理论的用户投资风格标签构建
        2.3.2 用户投资风格画像形式化建模
    2.4 实验分析与系统实现
        2.4.1 数据集获取与处理
        2.4.2 参数及实验设置
        2.4.3 评价指标的选取与设计
        2.4.4 投资者画像有效性验证
        2.4.5 系统实现与可视化展示
    2.5 本章小结
第3章 基于用户投资风格的证券推荐群体挖掘
    3.1 引言
    3.2 基础遗传算法模型构建
        3.2.1 遗传算法的特点
        3.2.2 传统遗传算法基本组成元素以及执行流程
    3.3 结合用户投资风格的用户群体划分模型设计
        3.3.1 遗传聚类算法优化设计
        3.3.2 投资者群体划分模型的构建以及说明
    3.4 实验设置及结果分析
        3.4.1 数据集及实验设置
        3.4.2 评价指标设置
        3.4.3 实验结果以及分析
    3.5 本章小结
第4章 基于用户投资风格与群体关系的证券推荐
    4.1 引言
    4.2 基于奇异值分解的推荐模型
    4.3 结合用户群体投资风格与双层奇异值分解的证券推荐模型
        4.3.1 结合用户群体划分的双层SVD证券推荐模型
        4.3.2 结合用户投资风格的证券推荐模型建模
    4.4 实验设置及结果分析
        4.4.1 数据集及实验设置
        4.4.2 评价指标设置
        4.4.3 实验结果以及分析
    4.5 本章小节
结论
参考文献
致谢

四、使用遗传算法实现K-means聚类算法的K值选择(论文参考文献)

  • [1]复杂大型建设项目费用偏差控制方法及信息系统设计[D]. 孙肖坤. 华北电力大学(北京), 2021(01)
  • [2]医药配送中心货到人拣选机器人多拣选台任务分配研究[D]. 宋晓东. 北京交通大学, 2021(02)
  • [3]基于耦合DNA-GA-P系统的聚类分析研究[D]. 姜珍妮. 山东师范大学, 2021(10)
  • [4]基于客流时空特征聚类分析的地铁列车运营时刻表优化研究[D]. 邢晓雨. 北京交通大学, 2021(02)
  • [5]配电网拓扑校验及中低压配电网电压控制策略研究[D]. 王俊逸. 山东科技大学, 2020(06)
  • [6]中铁快运物流总包运输方案编制关键技术研究[D]. 张敏. 北京交通大学, 2020(04)
  • [7]欠定条件下基于遗传算法的供水管网水力模型校核及应用研究[D]. 毛润康. 昆明理工大学, 2020
  • [8]基于多目标遗传算法的聚类方法研究[D]. 尹力. 重庆邮电大学, 2020(02)
  • [9]K-means聚类算法研究及在股票投资的应用[D]. 杨晓君. 重庆大学, 2019(01)
  • [10]基于用户投资风格的证券智能推荐方法研究[D]. 苏宏阳. 哈尔滨工业大学, 2019(02)

标签:;  ;  ;  ;  ;  

用遗传算法实现K-means聚类算法的K值选择
下载Doc文档

猜你喜欢