作者文章归档:zuojie@88.com

DataFrame的级联and合并操作


import pandas as pd
import numpy as np

级联操作

  • pd.concat, pd.append

pandas使用pd.concat函数,与np.concatenate函数类似,只是多了一些参数:

objs
axis=0
keys
join='outer' / 'inner':表示的是级联的方式,outer会将所有的项进行级联(忽略匹配和不匹配),而inner只会将匹配的项级联到一起,不匹配的不级联
ignore_index=False
  • 匹配级联
df1 = pd.DataFrame(data=np.rand...

Read more

Matplotlib基础二


import matplotlib.pyplot as plt
import numpy as np

plt.plot()绘制线性图

  • 绘制单条线形图
  • 绘制多条线形图
  • 设置坐标系的比例plt.figure(figsize=(a,b))
  • 设置图例legend()
  • 设置轴的标识
  • 图例保存
    • fig = plt.figure()
    • plt.plot(x,y)
    • figure.savefig()

In [2]:

#绘制单条线形图
x = np.array([1,2,3,4,5])
y = x + 3

plt.plot(x,y)

Out[2]:

[<matplotlib.lines...

Read more

数据可视化练习


#!/usr/bin/env python
# coding: utf-8

# In[1]:


import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv('city_temperature.csv',dtype={'State':object})


# In[2]:


data['AvgTemperature'] = (data['AvgTemperature']-32)/1.8


# In[3...

Read more

数据分析练习之城市气温分析


数据分析练习之城市气温分析

数据分析的方法很多,参考答案仅供参考,你也可以使用更加简洁高效的方法实现相同的功能。

数据下载(提取码:1024)

【练习1】准备数据和转换格式

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv('city_temperature.csv',dtype={'State':object})

# 温度转换
data['AvgTemperature'] =(data['AvgT...

Read more

Pandas转换与处理时间序列数据


Pandas转换与处理时间序列数据

# -*- coding: utf-8 -*-

import pandas as pd
order = pd.read_table('../data/meal_order_info.csv',
      sep = ',',encoding = 'gbk')
print('进行转换前订单信息表lock_time的类型为:', 
      order['lock_time'].dtypes)
order['lock_time'] = pd.to_date...

Read more

使用Pandas处理MySQL中的数据


使用Pandas链接MySQL

安装pymysql+sqlalchemy

 pip install pymysql sqlalchemy

简单案例

数据下载

import os
import pandas as pd
from sqlalchemy import create_engine
## 创建一个mysql连接器,用户名为root,密码为root123
## 地址为127.0.0.1,数据库名称为testdb,编码为utf-8
engine = create_engine(
    'mysql+pymysql://root:root123@127.0.0.1:3...

Read more

NumPy作业(2)


题目

numpy作业2-1 numpy作业2-1

import numpy as np
# 1题 
arr1 = np.arange(9).reshape(3,3)
arr1.max(axis=1) # 对于二维数组来说,axis=0 对列操作,axis=1 对行操作
array([2, 5, 8])
# 2题
arr2 = np.arange(36).reshape(2,3,6)
arr2
array([[[ 0,  1,  2,  3,  4,  5],
        [ 6,  7,  8,  9, 10, 11],
        [12, 13, 14, 15, 16, 17]],

     ...

Read more

Pandas案例练习-股票分析


需求:股票分析

  • 使用tushare包获取某股票的历史行情数据。
  • 输出该股票所有收盘比开盘上涨3%以上的日期。
  • 输出该股票所有开盘比前日收盘跌幅超过2%的日期。
  • 假如我从2010年1月1日开始,每月第一个交易日买入1手股票,每年最后一个交易日卖出所有股票,到今天为止,我的收益如何?

  • tushare财经数据接口包

    • pip install tushare

In [1]:

import tushare as ts
import pandas as pd
from pandas import DataFrame,Series
import numpy as np

In [2]:...

Read more

数据分析文档合集


Read more

NumPy作业(1)


import numpy as np

# 1.创建一个长度为10的ndarry对象,然后让第三个元素等于1

arr1 = np.zeros(10)
arr1[2] = 1
print(arr1)

# 2.创建10到49的ndarry对象

arr2 = np.arange(10, 50)
print(arr2)

# 3.反转arr2

arr3 = arr2[::-1]
print(arr3)

# 4.使用np.random.random

arr4 = np.random.random((10, 10))
print(arr4)
print(arr4.min())

# 5...

Read more