`
文章列表
来自‘统计学习简介’ 因变量-自变量关系的非线性 误差项的相关性 非恒定方差和正态分布误差 异常值/高杠杆点 共线性 总结了判断上述问题是否存在的方法以及相应的解决办法。这是统计学家面试时经常提出的问题,但该问 ...
一个统计假设是关于总体的假设 参数https://stattrek.com/statistics/dictionary.aspx?definition=parameter。这种假设可能是也可能不是。 假设检验是指统计学家用来接受或拒绝统计假设的正式程序。 参考https://stattrek.com/hypothesis-test/hypothesis-testing.aspx
描述统计 是用来描述收集的数据。 收集多少数据即对这些数据得出结论 推论统计 推论统计 在于使用我们收集的数据对‘更大的总体’数据得出结论。 我们通过具体的例子了解了: 1. 总体 —— 我们想要研究的整个群体。 2. ...
[Err] 1227 - Access denied; you need (at least one of) the SUPER privilege(s) for this operation -- ERROR 1725 (HY000) at line 1936: OPERATION need to be executed set by ADMIN --常见于RDS MySQL 5.5 5.7 直接看这篇 https://help.aliyun.com/knowledge_detail/41701.html

pandas.cut

pandas.cut用来把一组数据分割成离散的区间。比如有一组年龄数据,可以使用pandas.cut将年龄数据分割成不同的年龄段并打上标签。 原型 pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates='raise') #0.23.4 参数含义 x:被切分的类数组(array-like)数据,必须是1维的(不能用DataFrame); bins:bins是被切割后的区间(或者叫“桶”、“箱”、“面元”),有3中形式:一个int型的标量、标 ...

pandas——read_csv

read_csv 方法 返回数据类型: DataFrame:二维标记数据结构 列可以是不同的数据类型,是最常用的pandas对象,如同Series对象一样接受多种输入:lists/dicts/Series/DataFrame。 Series:一维标记数组 可以存储任意数据类型:int/string/float/Python对象,创建Series方法例子: s = Series(data, index = index) # data可以是Python字典/ndarray/标量值 调用方式: read_csv (*filepath_or_buffer*, *sep='*, *'*, *delimi ...
pandas.melt(frame, id_vars=None, value_vars=None, var_name=None, value_name='value', col_level=None) frame:要处理的数据集。 id_vars:不需要被转换的列名。 value_vars:需要转换的列名,如果剩下的列全部都要转换,就不用写了。 var_name和value_name是自定义设置对应的列名。 col_level :如果列是MultiIndex,则使用此级别。 例子: >>>d = {'col1': ['a','a','a','b','b'], 'col ...
执行JS的类库:execjs,PyV8,selenium,node 这里主要讲一下execjs,一个比较好用且容易上手的类库(支持py2,与py3),支持 JS runtime。 [url]https://pypi.org/project/PyExecJS/[/url] [url]https://www.cloudlakenet.com[/url] (一)安装: pip install PyExecJS 1 or easy_install PyExecJS 1 (二)运行时环境 execjs会自动使用当前电脑上的运行时环境(建议用nodejs,与Phantom ...
import matplotlib.pyplot as plt %matplotlib inline plt.rcParams['font.sans-serif']=['SimHei'] plt.rcParams['axes.unicode_minus']=False

nginx的upstream

nginx的upstream目前支持4种方式的分配 1、轮询(默认) 每个请求按时间顺序逐一分配到不同的后端服务器,如果后端服务器down掉,能自动剔除。 2、weight 指定轮询几率,weight和访问比率成正比,用于后端服务器性能不均的情况。 2、ip_hash 每个请求按访问ip的hash结果分配,这样每个访客固定访问一个后端服务器,可以解决session的问题。 3、fair(第三方) 按后端服务器的响应时间来分配请求,响应时间短的优先分配。 4、url_hash(第三方) 按访问url的hash结果来分配请求,使每个url定向到同一个后端服务器,后端服务器为缓存时 ...
Docker安装后,默认会创建下面三种网络类型 $ docker network ls NETWORK ID     NAME        DRIVER       SCOPE 9781b1f585ae    bridge       bridge       local 1252da701e55    host        host        local 237ea3d5cfbf    none        null        local 启动 Docker的时候,用 --network 参数,可以指定网络类型 docker run -itd --name test1 --net ...
names = input("Enter your name:") Enter your name: tom Traceback (most recent call last):   File "/Users/xa/study/py_study1/test.py", line 1, in <module>     names = input("Enter your name: ")   File "<string>", line 1, in <module> NameError: ...
那是因为你安装了Anaconda Jupyter 不要担心 这没什么影响,这是因为 auto_activate_base 设置为True (base) lifeideMBP:~ lf$  (base) lifeideMBP:~ lf$ conda config --show | grep auto_activate_base auto_activate_base: True 将其设置为:False,"(base)"字样将不会再显示: conda config --set auto_activate_base False 但是此时,命令行的Jupyter命令会失效, ...
很多人听过JMeter , 但Gatling是更有竞争力的解决方案 。 它能生成丰富多彩的报告, 含测试案例中收集的所有指标。 该功能比 JMeter 更好。 目前性能测试主要有两种类型,负载测试和压力测试: 负载测试:负载测试是一种主要为了测试软件系统是否达到需求文档设计的目标,譬如软件在一定时期内,最大支持多少并发用户数,软件请求出错率等,测试的主要是软件系统的性能。 压力测试:压力测试主要是为了测试硬件系统是否达到需求文档设计的性能目标,譬如在一定时期内,系统的cpu利用率,内存使用率,磁盘I/O吞吐率,网络吞吐量等,压力测试和负载测试最大的差别在于测试目的不同。 http ...
java 实现
Global site tag (gtag.js) - Google Analytics