首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 953 毫秒
1.
机器学习在当今诸多领域已经取得了巨大的成功,但是机器学习的预测效果往往依赖于具体问题.集成学习通过综合多个基分类器来预测结果,因此,其适应各种场景的能力较强,分类准确率较高.基于斯隆数字巡天(Sloan Digital Sky Survey,SDSS)计划恒星/星系中最暗源星等集分类正确率低的问题,提出一种基于Stacking集成学习的恒星/星系分类算法.从SDSS-DR7(SDSS Data Release 7)中获取完整的测光数据集,并根据星等值划分为亮源星等集、暗源星等集和最暗源星等集.仅针对分类较为复杂且困难的最暗源星等集展开分类研究.首先,对最暗源星等集使用10折嵌套交叉验证,然后使用支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)、XGBoost(eXtreme Gradient Boosting)等算法建立基分类器模型;使用梯度提升树(Gradient Boosting Decision Tree,GBDT)作为元分类器模型.最后,使用基于星系的分类正确率等指标,与功能树(Function Tree,FT)、SVM、RF、GBDT、XGBoost、堆叠降噪自编码(Stacked Denoising AutoEncoders,SDAE)、深度置信网络(Deep Belief Network,DBN)、深度感知决策树(Deep Perception Decision Tree,DPDT)等模型进行分类结果对比分析.实验结果表明,Stacking集成学习模型在最暗源星等集分类中要比FT算法的星系分类正确率提高了将近10%.同其他传统的机器学习算法、较强的提升算法、深度学习算法相比,Stacking集成学习模型也有较大的提升.  相似文献   

2.
机器学习在当今的诸多领域已经取得了巨大的成功.尤其是提升算法.提升算法适应各种场景的能力较强、准确率较高,已经在多个领域发挥巨大的作用.但是提升算法在天文学中的应用却极为少见.为解决斯隆数字巡天(Sloan Digital Sky Survey,SDSS)数据中恒星/星系暗源集分类正确率低的问题,引入了机器学习中较新的研究成果–XGBoost (eXtreme Gradient Boosting).从SDSS-DR7 (SDSS Data Release 7)中获取完整的测光数据集,并根据星等值划分为亮源集和暗源集.首先,分别对亮源集和暗源集使用十折交叉验证法,同时运用XGBoost算法建立恒星/星系分类模型;然后,运用栅格搜索等方法调优XGBoost参数;最后,基于星系的分类正确率等指标,与功能树(Function Tree, FT)、Adaboost (Adaptive boosting)、随机森林(Random Forest, RF)、梯度提升决策树(Gradient Boosting Decision Tree, GBDT)、堆叠降噪自编码(Stacked Denoising AutoEncoders, SDAE)、深度置信网络(Deep Belief Network, DBN)等模型进行对比并分析结果.实验结果表明:XGBoost在暗源分类中要比功能树算法的星系分类正确率提高了将近10%,在暗源集的最暗星等中比功能树提高了将近5%.同其他传统的机器学习算法和深度神经网络相比, XGBoost也有不同程度的提升.  相似文献   

3.
巡天观测与高能物理、黑洞天文等领域均有密切的联系.基于星系-超新星二分类问题,研究光谱数据预处理,结合余弦相似度改善PCA(Principal Component Analysis)光谱分解特征提取方法,用SDSS(the Sloan Digital Sky Survey)、WISeREP(the Weizmann Interactive Supernova data REPository)组成的5620条光谱数据集训练支持向量机,可以得到0.498%泛化误差的识别模型和新样本分类概率.使用Neyman-Pearson决策方法建立NPSVM(Neyman-Pearson Support Vector Machine)模型可进一步降低超新星的漏判率.  相似文献   

4.
对中国明安图超宽频谱射电日像仪(Mingantu Ultrawide Spectral Radioheliograph,MUSER)观测所得到的可见度数据进行标注(Flag),以剔除数据中的异常值是后续成图处理的一个重要工作.研究中利用支持向量机(Support Vector Machine,SVM)技术建立可信可见度数据标记模型,进而利用模型对可见度数据测试样本集进行测试标注.结果表明,该方法与传统基于统计的方法相比准确率有明显改进,可较好地判断出故障天线,对MUSER故障天线引起的可见度数据失真标记正确率可达到86%左右,且不受太阳爆发活动对数据的影响.  相似文献   

5.
本文基于Python设计和实现自动测光程序。首先扫描文件名实现文件分类;然后进行数据检查、预处理与孔径测光,并保存测光数据;最终由观测者指定目标星与比较星,程序从测光结果中提取相应星等与观测时间等数据,获得基于较差测光法的光变曲线。为解决数据提取中星图匹配问题,提出自动追踪移动目标的基于向量特征星图匹配算法,能自动匹配偏移较大的星图,并跟踪不断移动的小行星。使用本程序分别处理双星和小行星观测数据,并与IRAF(Image Reducation and Analysis Facility)测光结果比较,测光结果最大偏差分别为0.04 mag和0.043 mag,标准偏差分别为±0.005 mag和±0.007 mag。  相似文献   

6.
光谱分类不仅对理解恒星物理学有着重要意义,而且在研究银河系整体结构和演化过程中起着至关重要的作用.然而在相关研究中仍存在分类精度低和光谱型未知等问题,因此提出一种新的光谱自动分类模型并将其应用在F、G和K 3种恒星光谱的分类中,方法的基本思想是训练一个深度信念网络对光谱数据进行分层特征学习,然后采用反向传播算法对整个模型进行微调.从LAMOST (Large Sky Area Multi-Object Fiber Spectroscopic Telescope) Data Release 5 (DR5)中选取31667条包含F、G和K 3种恒星的光谱数据,并在TOPCAT软件中与GAIA (Global Astrometric Interferometer for Astrophysics)数据进行交叉,得到颜色-星等图并验证光谱数据的分布.最后对该模型进行评估,结果表明:深度信念网络在综合性能上优于其他分类算法.  相似文献   

7.
提出一种联合灰色模型(Grey Model,GM)和最小二乘支持机(Least-Squares Support Vector Machines,LS-SVM)回归算法的卫星钟差智能组合预报方法。首先根据历史钟差数据建立不同的GM(1,1)灰色模型,然后利用这些模型进行钟差预报,最后采用最小二乘支持向量机回归算法对不同GM(1,1)模型的预报结果进行非线性组合,以获得最终预报值。该方法在充分利用灰色模型所需原始数据少、建模简单等优点的基础上,结合最小二乘支持向量机所具有的小样本、非线性、泛化能力强等特性,提高了预报可靠性和精度。实例验证了该组合方法的可行性、有效性和实用性。  相似文献   

8.
针对卫星钟差(satellite clock bias,SCB)呈现非线性、非平稳变化的特性,提出结合经验模式分解(empirical mode decomposition,EMD)和最小二乘支持向量机(least squares support vector machines,LSSVM)的钟差预报方法.首先对钟差相邻历元间作一次差,并利用经验模式分解将差分序列分解成若干不同频率的平稳分量,分解后的分量突出了差分序列不同的局部特征;然后根据各个分量的变化规律,选择合适的核函数和相关参数构造不同的最小二乘支持向量机模型分别预报;最后将各分量预报值叠加得到一次差预报值,再将其还原得到钟差预报值.实验结果表明,所提方法与常用的二次多项式(quadratic polynomial,QP)模型、灰色系统(grey model,GM)模型和单一的最小二乘支持向量机模型相比,具有较高的预报精度和较强的泛化能力.  相似文献   

9.
低表面亮度星系(Low Surface Brightness Galaxy, LSBG)的特征对于理解星系整体特征非常重要, 通过现代的机器学习特别是深度学习算法来搜寻扩充低表面亮度星系样本具有重要意义. LSBG因特征不明显而难以用传统方法进行自动和准确辨别, 但深度学习确具有自动找出复杂且有效特征的优势, 针对此问题提出了一种可用于在大样本巡天观测项目中搜寻LSBG的算法---YOLOX-CS (You Only Look Once version X-CS). 首先通过实验对比5种经典目标检测算法并选择较优的YOLOX算法作为基础算法, 然后结合不同注意力机制和不同优化器, 构建了YOLOX-CS的框架结构. 数据集使用的是斯隆数字化巡天(Sloan Digital Sky Survey, SDSS)中的图像, 其标签来自于$\alpha.40$-SDSS DR7 (40%中性氢苜蓿巡天与第7次数据发布的斯隆数字化巡天的交叉覆盖天区)巡天项目中的LSBG, 由于该数据集样本较少, 还采用了深度卷积生成对抗网络(Deep Convolutional Generative Adversarial Networks, DCGAN)模型扩充了实验测试数据. 通过与一系列目标检测算法对比后, YOLOX-CS在扩充前后两个数据集中搜索LSBG的召回率和AP (Average Precision)值都有较好的测试结果, 其在未扩充数据集的测试集中的召回率达到97.75%, AP值达到97.83%, 在DCGAN模型扩充的数据集中, 同样测试集下进行实验的召回率达到99.10%, AP值达到98.94%, 验证了该算法在LSBG搜索中具有优秀的性能. 最后, 将该算法应用到SDSS部分测光数据上, 搜寻得到了765个LSBG候选体.  相似文献   

10.
提出了一种基于特征向量算法来估计Loran-C接收机天波延迟的信号处理新技术,为设计具有自适应调节最佳采样点的Loran-C接收机打下良好的基础.建立了基于频谱相除技术的信号模型,简要介绍了特征向量的谱估计算法.研究了此算法估计天波延迟的准确性,并与IFFT技术作了对比.仿真结果显示.特征向量算法比IFFT具有更高的分辨率和尖锐的波峰.最后,通过实测数据的实验验证了这些结论.  相似文献   

11.
星系的形态与星系的形成和演化息息相关, 其形态学分类是星系天文学后续研究的重要一环. 当前海量天文观测数据的出现使得天文数据自动分析方法越来越得到重视, 针对此问题, 利用先进的深度学习骨干网络EfficientNetV2, 分析不同的注意力机制类型和使用节点对网络性能的影响, 构建了一种命名为EfficientNetV2-S-Triplet7 (即在EfficientNetV2-S stage7的$1\times1$卷积层后加入Triplet模块)的改进算法模型来实现星系形态学的自动分类. 使用第二期星系动物园(Galaxy Zoo 2, GZ2)中超过24万张的测光图像作为初始数据进行实验测试. 在对数据进行预处理时采取了尺寸抖动、翻转、色彩畸变等图像增强手段来解决图像数量的不平衡问题. 在同一系列经典和前沿的深度学习算法模型AlexNet、ResNet-34、MobileNetV2、RegNet进行对比实验后, 得出EfficientNetV2-S-Triplet7算法在分类准确率、查全率和F1分数等指标上具有最好的测试结果. 在9375张测试图像中的3项指标值分别可达到89.03%、90.21%、89.93%, 查准率达到89.69%, 在其他模型中排在第3位. 该结果表明将EfficientNetV2-S-Triplet7算法应用于大规模星系数据的形态学分类任务中有很好的效果.  相似文献   

12.
太阳磁场的极性反转线(Polarity Inversion Line, PIL)是研究太阳活动、分析太阳磁场结构演变和预测太阳耀斑最重要的日面特征之一.磁场极性反转的位置是太阳耀斑和暗条可能出现的位置."先进天基太阳天文台(ASO-S)"是中国首颗空间太阳专用观测卫星,其搭载的"全日面矢量磁像仪(Full-Disk Vector Magnetograph, FMG)"主要任务是探测高空间、高时间分辨率的全日面矢量磁场.为了提高观测数据使用效率、快速监测太阳活动水平、提高太阳耀斑与日冕物质抛射的预报水平以及更好地服务于FMG数据处理与分析系统,采用了图像自动识别与处理技术,更加精确有效地检测极性反转线.从支持向量机(Support Vector Machine, SVM)的模型出发,将极性反转线位置的探测问题转化为一个模式识别中的二分类问题,提出了一种基于支持向量机的极性反转线检测算法,自动探测与识别太阳动力学天文台(Solar Dynamics Observatory, SDO)日震和磁成像仪(Helioseismic and Magnetic Imager, HMI)磁图的极性反转线位置.与现有算法的对比结果表明,此算法可以精确直观地检测太阳活动区的极性反转线.  相似文献   

13.
日冕物质抛射(Coronal Mass Ejection, CME)的检测是建立CME事件库和实现对CME在行星际传播的预报的重要前提. 通过Visual Geometry Group (VGG) 16卷积神经网络方法对日冕仪图像进行自动分类. 基于大角度光谱日冕仪(Large Angle and Spectrometric Coronagraph Experiment, LASCO) C2的白光日冕仪图像, 根据是否观测到CME对图像进行标记. 将标记分类的数据集用于VGG模型的训练, 该模型在测试集分类的准确率达到92.5%. 根据检测得到的标签结果, 结合时空连续性规则, 消除了误判区域, 有效分类出CME图像序列. 与Coordinated Data Analysis Workshops (CDAW)人工事件库比较, 分类出的CME图像序列能够较完整地包含CME事件, 且对弱CME结构有较高的检测灵敏度. 未来先进天基太阳天文台(Advanced Space-based Solar Observatory, ASO-S)卫星的莱曼阿尔法太阳望远镜将搭载有白光日冕仪(Solar Corona Imager, SCI), 使用此分类方法将该仪器产生的日冕图像按有无CME分类. 含CME标签的图像将推送给中国的各空间天气预报中心, 对CME进行预警.  相似文献   

14.
TESS (Transiting Exoplanet Survey Satellite)空间卫星提供的短曝光、高精度光度测量为寻找并区分变星与搜寻行星提供了良好的数据.利用变星源的光变曲线,使用周期频谱分析与光变折叠等一系列方法分析了TESS空间卫星21扇区19995颗拥有高质量光变数据的目标源,并对这些源进行了分类,共获得4624颗变星,其中食双星322颗、脉动变星470颗、行星凌星37颗.所得变星结果与VSX (The International Variable Star Index)变星表进行了交叉比较,共交叉匹配了625颗变星源,这些交叉源中共有131颗为食双星系统、31颗为脉动变星,并通过周期频谱分析获取了双星绕转以及脉动周期.另外在59颗变星中发现明显耀发现象,交叉源中有8颗变星为行星凌星并同样通过周期频谱分析获取了行星绕转周期,从而验证了TESS空间卫星数据对变星分析的可行性.通过利用TESS空间卫星21扇区获得的变星周期结果与VSX变星表中提供的变星周期对比,发现与VSX变星表中绝大部分变星的周期一致,有一部分结果与VSX变星表中的结果差别较大,对这些变星周期结果做了进一步修正,并给出了变星表未列出的变星周期结果.  相似文献   

15.
随着下一代射电天文望远镜的不断改进和发展,脉冲星巡天观测将发现数百万个脉冲星候选体,这给脉冲星的识别和新脉冲星的发现带来了巨大挑战,迅速发展的人工智能技术可用于脉冲星识别.使用Parkes望远镜的脉冲星数据集(The High Time Resolution Universe Survey,HTRUS),设计了一个14层深的残差网络(Residual Network,ResNet)进行脉冲星候选体分类.在HTRUS数据样本中,存在非脉冲星候选体(负样本)的数目远远大于脉冲星候选体(正样本)数目的样本非均衡问题,容易产生模型误判.通过使用过采样技术对训练集中的正样本进行数据增强,并调整正负样本的比例,解决了正负样本非均衡问题.训练过程中,使用5折交叉验证来调节超参数,最终构建出模型.测试结果表明,该模型能够取得较高的精确度(Precision)和召回率(Recall),分别为98%和100%,F1分数(F1-score)能够达到99%,每个样本检测完成只需要7 ms,为未来脉冲星大数据分析提供了一个可行的办法.  相似文献   

16.
针对目前从海量的快速射电暴(Fast Radio Burst, FRB)候选体中人工筛选FRB事件难以为继的现状,提出了一种基于卷积神经网络(Convolutional Neural Networks, CNN)的FRB候选体分类方法.首先,通过真实的观测数据和仿真FRB组成训练和测试样本集.其次,建立了二输入的深度卷积神经网络模型,并对其进行训练、测试和优化,获取FRB候选体分类器.最后,利用来自脉冲星的单脉冲数据对该分类器的有效性和性能进行了验证.实验结果表明,该方法可以快速从大量候选体中准确识别出单脉冲事件,极大地提高了FRB候选体的处理速率和效率.  相似文献   

17.
恒星光谱分类是天文学中一个重要的研究问题.对于已经采集到的海量高维恒星光谱数据的分类,采用模式匹配方法对光谱型分类较为成功,但其缺点在于标准恒星模版之间的差异性在匹配实际观测数据中不能体现出来,尤其是当需要进行光谱型和光度型的二元分类时模版匹配法往往会失败.而采用谱线特征测量的光度型分类强烈地依赖谱线拟合的准确性.为了解决二元分类的问题,介绍了一种基于卷积神经网络的恒星光谱型和光度型分类模型(Classification model of Stellar Spectral type and Luminosity type based on Convolution Neural Network, CSSL CNN).这一模型使用卷积神经网络来提取光谱的特征,通过注意力模块学习到了重要的光谱特征,借助池化操作降低了光谱的维度并压缩了模型参数的数量,使用全连接层来学习特征并对恒星光谱进行分类.实验中使用了大天区面积多目标光纤光谱天文望远镜(Large Sky Area Multi-Object Fiber Spectroscopy Telescope, LAMOST)公开数据集Data Release 5 (DR5,用了其中71282条恒星光谱数据,每条光谱包含了3000多维的特征)对该模型的性能进行验证与评估.实验结果表明,基于卷积神经网络的模型在恒星的光谱型分类上准确率达到92.04%,而基于深度神经网络的模型(Celestial bodies Spectral Classification Model, CSC Model)只有87.54%的准确率; CSSL CNN在恒星的光谱型和光度型二元分类上准确率达到83.91%,而模式匹配方法MKCLASS仅有38.38%的准确率且效率较低.  相似文献   

18.
张嘉 《天文学报》2015,56(1):91-92
<正>Algol型双星是双星的一种,其独特的半接结构使它拥有丰富的物理现象,包括严重畸变的充满子星、强磁活动现象,物质转移的各种形式,完全迥异于单星的演化状态和特有的形成历史.本文对双星光变曲线的基础物理做了介绍,同时介绍了历史上的各个模型或程序.展示了各个物理参数对光变曲线的影响,包括倾角、温度、金属丰度、表面重力加速度、第3光、半径、轨道椭率和轨道近点角等.根据已有星表统计了Algol型双星的性质,并对3颗样本星进行了具体的观测和分析,结果如下:  相似文献   

19.
星系形态与星系的形成和演化有着密切的联系,因此星系形态分类(galaxy morphology classification)成为研究不同星系物理特征的重要过程之一。斯隆数字巡天(Sloan Digital Sky Survey, SDSS)等大型巡天计划产生的海量星系图像数据对星系形态的准确、实时分类提出了新的挑战,而深度学习(deep learning)算法能有效应对这类海量星系图片的自动分类考验。面向星系形态分类问题提出了一种改进的深度残差网络(residual network, ResNet),即ResNet-26模型。该模型对残差单元进行改进,减少了网络深度,并增加了网络宽度,实现了对星系形态特征的自动提取、识别和分类。实验结果表明,与Dieleman和ResNet-50等其他流行的卷积神经网络(convolution neural network, CNN)模型相比,ResNet-26模型具有更优的分类性能,可应用于未来大型巡天计划的大规模星系形态分类系统。  相似文献   

20.
AST3-2 (Antarctic Survey Telescopes)光学巡天望远镜位于南极大陆最高点冰穹A,其产生的大量观测数据对数据处理的效率提出了较高要求.同时南极通信不便,数据回传有诸多困难,有必要在南极本地实现自动处理AST3-2观测数据,进行变源和暂现源观测的数据处理,但是受到低功耗计算机的限制,数据的快速自动处理的实现存在诸多困难.将已有的图像相减方案同机器学习算法相结合,并利用AST3-2 2016年观测数据作为测试样本,发展一套的暂现源及变源的筛选方法成为可行的选择.该筛选方法使用图像相减法初步筛选出可能的变源,再用主成分分析法抽取候选源的特征,并选择随机森林作为机器学习分类器,在测试中对正样本的召回率达到了97%,验证了这种方法的可行性,并最终在2016年观测数据中探测出一批变星候选体.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号