分类目录归档:数据分析

使用Pandas处理MySQL中的数据


使用Pandas链接MySQL

安装pymysql+sqlalchemy

 pip install pymysql sqlalchemy

简单案例

数据下载

import os
import pandas as pd
from sqlalchemy import create_engine
## 创建一个mysql连接器,用户名为root,密码为root123
## 地址为127.0.0.1,数据库名称为testdb,编码为utf-8
engine = create_engine(
    &...

Read more

NumPy作业(2)


题目

numpy作业2-1 numpy作业2-1

import numpy as np
# 1题 
arr1 = np.arange(9).reshape(3,3)
arr1.max(axis=1) # 对于二维数组来说,axis=0 对列操作,axis=1 对行操作
array([2, 5, 8])
# 2题
arr2 = np.arange(36).reshape(2,3,6)
arr2
array([[[ 0,  1,  2,  3,  4,  5],
        [ 6,  7,  8,  9, 10, 11...

Read more

Pandas案例练习-股票分析


需求:股票分析

  • 使用tushare包获取某股票的历史行情数据。
  • 输出该股票所有收盘比开盘上涨3%以上的日期。
  • 输出该股票所有开盘比前日收盘跌幅超过2%的日期。
  • 假如我从2010年1月1日开始,每月第一个交易日买入1手股票,每年最后一个交易日卖出所有股票,到今天为止,我的收益如何?

  • tushare财经数据接口包

    • pip install tushare

In [1]:

import tushare as ts
import pandas as pd
from pandas import D...

Read more

数据分析文档合集


Read more

NumPy基础(四)


# 矩阵操作
import numpy as np

# 1.创建numpy矩阵
'''
np.mat("1 2 3;4 5 6;7 8 9")
np.matrix([[1,2,3],[4,5,6],[7,8,9]])
np.bmat("arr1 arr2;arr1 arr2")
'''

mat1 = np.mat("1 2 3;4 5 6;7 8 9")
print(mat1)
print(...

Read more

NumPy基础(三)


# 导入numpy模块并起别名为np
import numpy as np

# 显示当前numpy的版本号
print(np.__version__)

# 0.数组的概念
'''
数组是一个容器,它可以存放一定数量的元素,这些元素类型相同。
'''

# 1.创建一维数组
arr1 = np.array([1, 2, 3, 4])

print("创建数组:", arr1)

# 2.创建二维数组
'''
...

Read more

Jupyter notebook使用说明


简介

Jupyter Notebook是基于网页的用于交互计算的应用程序。其可被应用于全过程计算:开发、文档编写、运行代码和展示结果。——Jupyter Notebook官方介绍

简而言之,Jupyter Notebook是以网页的形式打开,可以在网页页面中直接编写代码和运行代码,代码的运行结果也会直接在代码块下显示。如在编程过程中需要编写说明文档,可在同一个页面中直接编写,便于作及时的说明和解释。

Jupyter Notebook的主要特点:

  • 编程时具有语法高亮、缩进、tab补全的功能。

  • ...

Read more

认识数据分析


数据分析概念【来源于百度百科】

  • 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。

  • 通俗来讲数据分析的目的是把隐藏在一大批看来杂乱无章的数据中的信息集中和提炼出来,从而找出所研究对象的内在规律。

  • 数据分析是数学和计算机科学相结合的产物。

数据分析的应用

​ 随着数据时代的蓬勃发展,越来越多的企事业单位开始认识到数据的重要性,并...

Read more

Matplotlib基础一


image-20220315090111641

  • Matplotlib是Python中最常用的可视化工具之一,可以非常方便地创建海量类型的2D图表和一些基本的3D图表,可根据数据集(DataFrame,Series)自行定义x,y轴,绘制图形(线形图,柱状图,直方图,密度图,散布图等等),能够满足大部分需要。
  • Matplotlib最早是为了可视化癫痫病人的脑皮层电图相关的信号而研发,因为在函数的设计上参考了MATLAB,所以叫做Matplotlib。
  • 官方文档: https://matplotlib.org/
  • Matplotlib中最基础的模块是...

Read more