Python特征降维知识点总结

 更新时间:2021年08月15日 11:45:17   作者:小妮浅浅  
在本篇文章里小编给大家整理了一篇关于Python特征降维知识点总结内容,有需要的朋友们可以学习参考下。

说明

1、PCA是最经典、最实用的降维技术,尤其在辅助图形识别中表现突出。

2、用来减少数据集的维度,同时保持数据集中对方差贡献最大的特征。

保持低阶主成分,而忽略高阶成分,低阶成分往往能保留数据的最重要部分。

实例

from sklearn.feature_selection import VarianceThreshold

# 特征选择  VarianceThreshold删除低方差的特征(删除差别不大的特征)
var = VarianceThreshold(threshold=1.0)   # 将方差小于等于1.0的特征删除。 默认threshold=0.0
data = var.fit_transform([[0, 2, 0, 3], [0, 1, 4, 3], [0, 1, 1, 3]])
 
print(data)
'''
[[0]
 [4]
 [1]]
'''

内容扩展:

python实现拉普拉斯降维

def laplaEigen(dataMat,k,t): 
 m,n=shape(dataMat) 
 W=mat(zeros([m,m])) 
 D=mat(zeros([m,m])) 
 for i in range(m): 
 k_index=knn(dataMat[i,:],dataMat,k) 
 for j in range(k): 
  sqDiffVector = dataMat[i,:]-dataMat[k_index[j],:] 
  sqDiffVector=array(sqDiffVector)**2 
  sqDistances = sqDiffVector.sum() 
  W[i,k_index[j]]=math.exp(-sqDistances/t) 
  D[i,i]+=W[i,k_index[j]] 
 L=D-W 
 Dinv=np.linalg.inv(D) 
 X=np.dot(D.I,L) 
 lamda,f=np.linalg.eig(X) 
return lamda,f 
def knn(inX, dataSet, k): 
 dataSetSize = dataSet.shape[0] 
 diffMat = tile(inX, (dataSetSize,1)) - dataSet 
 sqDiffMat = array(diffMat)**2 
 sqDistances = sqDiffMat.sum(axis=1) 
 distances = sqDistances**0.5 
 sortedDistIndicies = distances.argsort() 
return sortedDistIndicies[0:k] 
dataMat, color = make_swiss_roll(n_samples=2000) 
lamda,f=laplaEigen(dataMat,11,5.0) 
fm,fn =shape(f) 
print 'fm,fn:',fm,fn 
lamdaIndicies = argsort(lamda) 
first=0 
second=0 
print lamdaIndicies[0], lamdaIndicies[1] 
for i in range(fm): 
 if lamda[lamdaIndicies[i]].real>1e-5: 
 print lamda[lamdaIndicies[i]] 
 first=lamdaIndicies[i] 
 second=lamdaIndicies[i+1] 
 break 
print first, second 
redEigVects = f[:,lamdaIndicies] 
fig=plt.figure('origin') 
ax1 = fig.add_subplot(111, projection='3d') 
ax1.scatter(dataMat[:, 0], dataMat[:, 1], dataMat[:, 2], c=color,cmap=plt.cm.Spectral) 
fig=plt.figure('lowdata') 
ax2 = fig.add_subplot(111) 
ax2.scatter(f[:,first], f[:,second], c=color, cmap=plt.cm.Spectral) 
plt.show() 

到此这篇关于Python特征降维知识点总结的文章就介绍到这了,更多相关Python特征降维如何理解内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python ARP扫描与欺骗实现全程详解

    Python ARP扫描与欺骗实现全程详解

    这篇文章主要介绍了Python 实现ARP扫描与欺骗,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习吧
    2022-10-10
  • Python实现解析命令行参数的常见方法总结

    Python实现解析命令行参数的常见方法总结

    除ide的执行方式外,命令行的方式执行Python脚本是参数化程序执行的一种常见且简单的方法。本文总结了三个常见的获取和解析命令行参数的方法,需要的可以参考一下
    2022-10-10
  • Python解析最简单的验证码

    Python解析最简单的验证码

    最近在学python,正好遇到学校需要选宿舍,就用python写了一个抢宿舍的软件。下面通过本文给大家介绍python解析最简单的验证码,对python解析验证码相关知识感兴趣的朋友一起学习吧
    2016-01-01
  • 18个帮你简化代码的Python技巧分享

    18个帮你简化代码的Python技巧分享

    选择学习 python 时,最令我震惊的是它的简单性和可读性。但是你知道还可以用更少的代码行可以让 Python 代码变得更简单吗?本文为大家总结了18个帮你简化代码的Python技巧,感兴趣的可以了解一下
    2022-07-07
  • 利用python微信库itchat实现微信自动回复功能

    利用python微信库itchat实现微信自动回复功能

    最近发现了一个特别好玩的Python 微信库itchat,可以实现自动回复等多种功能,下面这篇文章主要给大家介绍了利用python微信库itchat实现微信自动回复功能的相关资料,需要的朋友可以参考学习,下面来一起看看吧。
    2017-05-05
  • 详解如何用python实现一个简单下载器的服务端和客户端

    详解如何用python实现一个简单下载器的服务端和客户端

    这篇文章主要介绍了详解如何用python实现一个简单下载器的服务端和客户端,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-10-10
  • python利用JMeter测试Tornado的多线程

    python利用JMeter测试Tornado的多线程

    这篇文章主要介绍了python利用JMeter测试Tornado的多线程,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-01-01
  • Python巧用SnowNLP实现生成srt字幕文件

    Python巧用SnowNLP实现生成srt字幕文件

    SnowNLP是一个可以方便的处理中文文本内容的python类库,本文主要为大家详细介绍了Python如何巧用SnowNLP实现将一段话一键生成srt字幕文件,感兴趣的可以了解下
    2024-01-01
  • python远程邮件控制电脑升级版

    python远程邮件控制电脑升级版

    这篇文章主要为大家详细介绍了python3.4远程控制电脑开关机,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-05-05
  • Python函数式编程指南(三):迭代器详解

    Python函数式编程指南(三):迭代器详解

    这篇文章主要介绍了Python函数式编程指南(三):迭代器详解,本文讲解了迭代器(Iterator)概述、使用迭代器、生成器表达式(Generator expression)和列表解析(List Comprehension)等内容,需要的朋友可以参考下
    2015-06-06

最新评论