train_test_split用法总结
sklearn.model_selection.train_test_split随机划分训练集和测试集
官网文档:http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html#sklearn.model_selection.train_test_split
一般形式:
train_test_split是交叉验证中常用的函数,功能是从样本中随机的按比例选取train_data和test_data,形式为:
X_train,X_test, y_train, y_test =cross_validation.train_test_split(train_data,train_target,test_size=0.4, random_state=0)
cross_validatio为交叉验证
参数解释:
train_data:所要划分的样本特征集
train_target:所要划分的样本结果
test_size:样本占比,如果是整数的话就是样本的数量
random_state:是随机数的种子。
随机数种子:其实就是该组随机数的编号,在需要重复试验的时候,保证得到一组一样的随机数。比如你每次都填1,其他参数一样的情况下你得到的随机数组是一样的。但填0或不填,每次都会不一样。
随机数的产生取决于种子,随机数和种子之间的关系遵从以下两个规则:
种子不同,产生不同的随机数;种子相同,即使实例不同也产生相同的随机数。
import numpy as np
from sklearn.model_selection import train_test_split
X,y=np.arange(10).reshape((5,2)),range
X=np.array([[0,1],[2,3],[4,5],[6,7],[8,9]])
y=[0,1,2,3,4]
print(X)
print(y)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=0)
print(X_train)
print(y_train)
print(X_test)
print(y_test)
结果为
[[0 1]
[2 3]
[4 5]
[6 7]
[8 9]]
[0, 1, 2, 3, 4]
[[2 3]
[6 7]
[8 9]]
[1, 3, 4]
[[4 5]
[0 1]]
[2, 0]
相关文章
- Android UI--ViewPager扩展Tab标签指示,android开发网上购物app
布局搞定之后,定义一个适配器如下: package com.wwj.viewpager; import java.util.List; import android.support.v4.view.PagerAdapter; import android.view.View; import android.view.ViewGroup; /** ViewPager适配器 author wwj */ publi…...
2023/3/26 18:52:40 - Vue基础学习
引自:https://mrbird.cc/Vue-Learn-Note.html mrbird大佬博客 Vue 入门 <!DOCTYPE html><html lang"en"><head><meta charset"UTF-8"><title>todoList</title><script src"https://cdn.jsdelivr…...
2023/3/26 18:49:30 - DHCP工作原理
DHCP工作原理图DHCP关键知识点DHCP服务器数据传输的端口为UDP67DHCP客户机数据传输的端口为UDP68客户机的源IP地址为:0.0.0.0客户机的目的IP地址:255.255.255.255DHCP过程详解发现阶段:DHCP客户机获取网络中DHCP服务器信息的阶段提供阶段:DHCP SERVER向DHCP客户机提供预分配…...
2023/3/26 18:41:22 - java笔记7----java中的方法、递归
1、方法 方法的定义 在程序开发的过程中,会编写到很多重复的代码,,可以使用方法对这些代码进行管理,可以使用方法实现对代的管理和重用(重复使用),可以把方法理解成一个可以重复多次使用的功能。 方法的格式 在给方法…...
2023/3/26 18:40:04 - 很好用的chrome 插件合集,不要错过
通用类插件 1、OneTab:将无数 Tab 合并在一个页面 很多时候我们在一个窗口打开太多的tab,每一个tab太小不容易管理,这时候使用OneTab能够把所有tab收起放在一个页面,点击就可打开该tab,非常方便。 2、Momentum&#x…...
2023/3/26 18:39:18 - 劳动争议案件是不是一定要用普通程序
一、劳动争议案件是不是一定要用普通程序 法律没有规定劳动争议案件一定要用普通程序,劳动争议案件仲裁后,如果不服裁决,向法院起诉的,案情比较简单的,法院可以用简易程序审理。 《中华人民共和国民事诉讼法》 第一…...
2023/3/26 18:36:37 - 读 Linux 像读小说「GitHub 热点速览 v.22.03」
本周特推选取了一个画风有点意思的 Linux 代码带读项目 flash-linux0.11-talk,希望有趣的文风能带你读完 Linux 代码。当然画风可以增加阅读体验,彩色标记也是一种学习方法——annotated_latex_equations 手把手教你学各种各样彩色的公式注释,那色彩就像是 GitHub 移动端新支…...
2023/3/26 17:47:11 - Mysql集群架构
1. 集群架构设计 1.1 架构设计理念 主要从三个维度考虑问题: 可用性扩展性一致性 1.2 可用性设计 站点高可用,冗余站点服务高可用,冗余服务数据高可用,冗余数据 保证高可用的方法是冗余。 但是数据冗余带来的问题是数据一致性…...
2023/3/26 17:05:09 - mysql使用二进制安装报错:error: rpmdb: BDB0113 Thread/process 13162/139635734849600 failed: BDB1507 Thread die
本文主要遇到的问题,使用二进制命令报错yum -y install mysql-community-server安装mysql报错,报错如下: [rootoldboy soft]# yum -y install mysql-community-server error: rpmdb: BDB0113 Thread/process 13162/139635734849600 failed: BDB1507 Thr…...
2023/3/26 16:58:10 - python 工业软件开发_记一次工业软件开发经历
项目概述项目背景:工厂表面处理产线项目b司接了a司一条表面处理产线的项目,包含硬件及软件,由于现在b司做的软件难用且数据难以查找,a司不满意验收不通过,款项没有结清。所有b司找到我们,希望我们能帮他搞定这个软件系…...
2023/3/26 16:55:16 - 10分钟教你写出 坦克大战【无敌版】
导读 最近读到一位大佬的游戏文章之后,手痒难耐就想自己也写一个小游戏。苦于没有游戏素材在网上搜也都是付费的,我就随便写了一点点来给自己解解馋。😗 好了废话不多说我们现在先试一下游戏效果。不好玩也不要说出来,嘻嘻嘻。后…...
2023/3/26 16:49:20 - js 日期增加加天数计算
//日期加天数计算 date:时间戳, days:天数 默认1天 function AddDate(date, days) {if (!days) {days 1;}var date new Date(date);date.setDate(date.getDate() days);return date; }...
2023/3/26 15:54:07 - 惊呆了!这个视频压缩工具太强大了叭!!一键压制降维打击,体积小、无损画质!
上链接 旧版-传送门1-够用了 新版-传送门2-没必要-钥匙:提取码:74l8 使用方法 打开即食 界面长这样 其余的默认即可,你又不是专业的,我也不是,听话! 最多调一下CRF值,这个值,越…...
2023/3/26 15:53:05 - mysql bdb_深入理解mysql之BDB系列(2)---数据元页结构(摘自老杨)
三:数据元页结构3.1 metepage头结构该结构是一个公共结构。用于B树matapage页、HASH的matepage页以及queue的metapage。typedef struct _dbmeta33 {DB_LSN lsn; //LSNdb_pgno_t pgno; //当前页号u_int32_t magic; //调试用的魔数u_int32_t version; //数据库的当前版…...
2023/3/26 15:42:01 - 实习、校招面试的一点经验
最近学校的应届生、准应届生都开始准备着找(实习)工作,我的辅导员旭哥希望我能够给学习学妹们分享一下找工作相关的内容,我只好厚着脸皮分享一下我对面试的一点看法^^ 我把面试分成三个过程(面前、面中、面后…...
2023/3/26 15:38:32 - 1970年代-大规模集成芯片(LSI)、ASIC和电子游戏吃豆人的诞生
1970年代发展迅速的十年,BASIC和C高级编程语言在这十年中被广泛采用,大规模集成芯片(LSI)、ASIC等也被广泛应用到电子游戏中,同时经典游戏《吃豆人》和《星际迷航》也在这个时期诞生的,接下来让我们看看这十…...
2023/3/26 15:37:01 - 数据科学中的陷阱:定性变量的处理
定性变量,也就是表示类别的变量,比如性别、省份等。对于这类变量,不能在模型里直接使用它们,因为定性变量之间的数学计算是毫无意义的。另一方面,定性变量是一类很常见的变量,通常带着很有价值的信息。因此…...
2023/3/26 15:31:03 - 专业视频压制神器下载——解决会声会影、PR、AE处理视频后过大的问题(三款工具)专业视频压制软件
文章目录1. 按2. 工具下载3. 使用说明3.1. 小丸子工具箱1. 按 会声会影、PR、AE处理视频后文件过大怎么办?专业视频压制软件 第一种方法就是用格式工厂再处理一下会声会影(PR、AE)的输出文件,第二种用狸窝(不过这款软…...
2023/3/26 15:28:48 - lnmp
一、如何安装LNMP架构环境。 1.安装nginx [rootweb01 ~]# vim /etc/yum.repos.d/nginx.repo [nginx-stable] namenginx stable repo baseurlhttp://nginx.org/packages/centos/releasever/releasever/releasever/basearch/ gpgcheck1 enabled1 gpgkeyhttps://nginx.org/keys/n…...
2023/3/26 15:24:42 - 60岁代码匠的几篇小作文,解决了大多数程序的迷茫(上)
陈德伟 | 译 不熟悉计算机底层原理,我能走多远?30 了,会被裁吧?到底学哪门编程语言更有前(钱)途? …… 裁员大潮,行业高度内卷带来的焦虑迫使我们总是重复面对以上问题,它…...
2023/3/26 15:23:47
最新文章
- train_test_split用法总结
sklearn.model_selection.train_test_split随机划分训练集和测试集 官网文档:http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html#sklearn.model_selection.train_test_split 一般形式: train_test_spli…...
2023/3/26 19:15:53 - 数据结构之图(关键路径)
AOE网 对应的顶点上的事情进行需要对应入边进行完 对应出边的事情进行需要对应顶点的事情进行 现在我们把顶点称为事件(顶点事件的完成不需要时间(没有权值)) 但是对于的活动(边)需要时间(对于的…...
2023/3/26 19:15:47 - 第四章:Java琐事
乐观锁和悲观锁悲观锁乐观锁八种案例演示synchronized到底锁的是什么字节码角度分析 Synchronizedsynchronized 同步代码块synchronized 同步方法为什么任意一个对象都可以是锁?公平锁和非公平锁为什么会有公平锁/非公平锁的设计?为什么默认是非公平&…...
2023/3/26 19:15:33 - 多目标水母搜索(MOJS)算法(Matlab实现)
💥💥💥💞💞💞欢迎来到本博客❤️❤️❤️💥💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑…...
2023/3/26 19:15:32 - DEJA_VU3D - Cesium功能集 之 091-绘制等高线(纯前端)
前言 编写这个专栏主要目的是对工作之中基于Cesium实现过的功能进行整合,有自己琢磨实现的,也有参考其他大神后整理实现的,初步算了算现在有差不多实现小130个左右的功能,后续也会不断的追加,所以暂时打算一周2-3更的样子来更新本专栏(尽可能把代码简洁一些)。博文内容…...
2023/3/26 19:15:22 - 【C++】list用法简单模拟实现
文章目录1. list的介绍及使用1.1 list基本概念1.2 list的构造1.3 list的迭代器使用1.4 list 赋值和交换1.5 list 插入和删除1.6 list容量大小操作1.7 list 数据存取2. list的模拟实现这次要模拟实现的类及其成员函数接口总览2.1 结点类的实现2.2 迭代器的模拟实现2.3 反向迭代器…...
2023/3/26 19:15:19 - 展锐UDX710:ProSLIC SI32185移植适配(未完待续)
一、SLIC基本流程图 在展锐UDX710平台上新增slic 驱动,可将应用代码置于source/unisoc/atrouter2.0下面,Si32185驱动代码放置于kernel,通过IOCTL对slic器件进行控制。整体流程如下图所示: 二、ProSLIC SI32185驱动调试 1. DTS 控制通路SPI0需增加一个spidev用于绑定对…...
2023/3/26 19:15:13 - Rxjava源码分析实践(五)【实践环节:Rxjava整体框架的实现】
上一章节,我们从简单的Rxjava使用入手,深入学习探索了Rxjava原理,也知道了Rxjava最重要的几个功能,链式调用、响应式编程、事件流转换、线程切换,接下来我们就一步一步的结合源码+实践,来实现这些核心功能。 本节,我们一起来实现Rxjava的响应式编程的功能,其实就是借助…...
2023/3/26 19:14:37 - 联想M7268激光打印机开机红绿灯双闪报错不打印
故障现象: 一台联想M7268激光打印机开机后电源键、复印键一起双闪,电源键闪红灯、复印键闪绿灯; 检测维修: 根据闪灯故障判断如果无卡纸异常情况下可能是激光器故障,因为以前曾经维修过一台一模一样的机器故障基本相同,先打开机器吧,把硒鼓拿出来先看看有没有卡纸,进纸…...
2023/3/26 19:14:19 - 电磁兼容EMC详解及测试流程
一、电磁兼容EMC概念 EMC,全称为Electromagnetic Compatibility,即电磁兼容性;是指设备或系统在其电磁环境中能正常工作且不对该环境中任何事物构成不能承受电磁骚扰的能力。 因此,EMC包括两个方面的要求:一方面是指设备在正常运行过程中对所在环境产生的电磁干扰不能超过…...
2023/3/26 19:14:15 - 实用指南:如何在Anolis OS上轻松使用 Kata 安全容器?
文/云原生SIG本篇文章我们将详细介绍怎么轻松在 Anolis OS 上使用 Kata Containers 安全容器,我们将介绍 Kata Container 社区于 2022 年 10 月 10 日最新发行的 Kata3.0.0 的安装部署方式,3.0.0 版本包含了基于袋鼠 RunD 开源的最新 Rust Kata runtime …...
2023/3/26 19:14:09 - 灵界的科学丨六、星际通信新科技──寻找外星人
摘自李嗣涔教授《灵界的科学》 外星先进文明科技领先地球的关键, 是外星人掌握了意识的物理, 能够制造仿照天眼的仪器, 自由进出虚数空间遨游宇宙,同时创造出瞬间科技。 人类未来学习的典范,就在天上无数的外星先进…...
2023/3/26 19:14:04 - C# !(null包容)运算符的使用
总目录 文章目录总目录前言一、!(null包容)运算符是什么?二、!(null包容)运算符如何使用?1.使用2.扩展-预处理器指令启用或关闭null检查总结前言 本文主要讲解!(null包容)运算符的使用…...
2023/3/26 19:14:01 - 数据库等值查询与统计信息
概念 统计信息是为优化器的 cost 估算提供数据支撑,其中很重要的一点需求便是等值查询(EQUALS, IN 等) 场景下的基数估算。考虑以下 Case CREATE TABLE mc_tac_template (ID BIGINT ,NAME varchar(50) NOT NULL,GENDER varchar(10) NOT NULL,PRIMARY KEY (ID),KEY…...
2023/3/26 19:13:56 - Vue09/Vue 配置二级路由实现路由嵌套 、组件缓存 keep-alive 和 keep-alive属性方法及两个钩子函数
一.Vue 配置二级路由 { path: /路由地址, component: 组件名, children: [ { path: /路由地址, component: 组件名 } ] } 介绍: 项目中如果都是一级路由,路由管理会有些乱,嵌套路由是路由内包含路由的意思,组件中可以有自己的路由导航和路…...
2023/3/26 19:13:51 - 【云原生 | Kubernetes 系列】--Gitops持续交付 ArgoCD自动同步策略
1. ArgoCD自动同步策略 自动同步策略允许ArgoCD在检测到GitRepo与实际状态之间存在差异时,自动启动同步操作. Prune Resource(自动修剪):在集群上某个资源在GitRepo中找不到对应的配置时,自动删除集群上的该资源 Self Heal(自愈): 因各种原因(如手动修改)集群上资源的实时状态…...
2023/3/26 19:13:50 - EMQX Enterprise 4.4.124.4.13 发布:集群负载重平衡、TDengine 3.0 适配以及子表批量插入
我们很高兴地告诉大家,EMQX Enterprise 4.4.12 以及 4.4.13 版本正式发布! 在本次发布中,我们带来了集群负载重平衡与节点疏散功能为运维人员提供更灵活的集群管理方式,适配了 TDengine 3.0 版本并新增分表批量插入功能ÿ…...
2023/3/26 19:13:43 - 【ESP 保姆级教程】玩转emqx认证篇① ——控制客户端连接,认证安全
忘记过去,超越自己 ❤️ 博客主页 单片机菜鸟哥,一个野生非专业硬件IOT爱好者 ❤️❤️ 本篇创建记录 2023-01-15 ❤️❤️ 本篇更新记录 2022-01-15 ❤️🎉 欢迎关注 🔎点赞 👍收藏 ⭐️留言📝🙏 此博客均由博主单独编写,不存在任何商业团队运营,如发现错误,请…...
2023/3/26 19:13:36 - leetcode860柠檬水找零-暴力递归解法和贪心解法
说明:问题描述来源leetcode; 题解1: /*** author xin麒* date 2023/1/18 16:20* 在柠檬水摊上,每一杯柠檬水的售价为5美元。顾客排队购买你的产品,(按账单 bills 支付的顺序)一次购买一杯。* 每位顾客只买…...
2023/3/26 19:13:19 - 观看课程领奖品!Imagination中国区技术总监全面解读 IMG DXT GPU
此前,我们发布了一系列关于 IMG DXT GPU 的介绍,为了让更多读者了解其背后的技术及应用方向,我们特别邀请 Imagination 中国区技术总监艾克录制全新在线课程,为大家全面解读IMG DXT GPU。 点击这里,马上注册观看&…...
2023/3/26 19:13:13