全程班
632人加入学习
(0人评价)
CFTA 一级全程班(课程有效期:两年)
价格 ¥ 8800.00

报错:invalid syntax 无效的句法

除法,获得浮点数

取证运算符 //

例如:3//2  得到:  1

或者,用int(3/2)   得到: 1

驼峰命名法

回车用:  \n

count方法有点,s3字符串里有多少个换行

字符串就像羊肉串,将字符串起来。-字符串之后就不能改里面的某一个字符。

s4【10】是表示处理第11个。

.count是方法,必须有对象,字符串才有这个统计方法。

.replace也是方法,必须有对象

str函数转化为字符串

type是函数,不是方法,前面没有点的。

Key:切片操作(非常重要)

  • unicode 统一码
  • list函数将字符串转成列表-把羊肉串拆成一块一块。
  • s[:3]表示0-第3个。-截取字符,容易出错。
  • 口诀:五种变形,三种负数。
  1. a和b都是正数时,a+1,b不变。
  2. 变形:[:b]  [a:] [a:b] [:] [x]
  3. a和b是负数,a不变,b-1。
  • 特殊字符分转义和不转义:\  r‘’-r表示raw。
  • 逗号分隔--用split拆分
  • []表示列表
  • 双冒号分隔符--用join是一种方法,必须是一个列表或元组
  • 定位:
  1. in 左边是否在右边里面
  2.  index     find (?)-与视频结果不一致
  • 练习!

 key :模块化/格式化--format-字符串格式化是个很深的主题

  • f:浮点
  • s:字符串
  • d:整数
  •  

切片总结: 自我总结,不知可否推广?

int     float  bool   str

[展开全文]

NaN(not a number ) ,事先引入pandas and numpy 先

import pandas as pd
import numpy as np

也可以缺失值用拉格朗日插值法 或者移动均值代替缺失的值。

dropna()方法会将凡事有na 的数据行整行删除。如果删除na 的单元需要正价条件,如, data.dropna(how='all')

如果删除na 的单元需要正价条件,如, data.dropna(how='all')

df.iloc[a:b,c:d] #--i表示index iloc(index location)如果没有index 表示找值, iloc 表示按索引位置而不是值,【a:b,c:d】表示行从a+1行, 到b行, 同理 c:d 表示从c+1列到d列。

 

上面这一页部分不大会考

[展开全文]

Python+MySOL=70%

统计+经济模型+财务报表=30%

题型:单选+多选=60分;

问答题:40分(1.给一段程序,进行逻辑分析2。应用,业务场景,设计Python、数据库、财务分析)

学习方法:1.合理安排学习计划

2.多动手,编程(一抄二改三造)

3.最后关头二八原则

[展开全文]

绝对地址、默认地址

data=pd.read_csv('路径\文件名') 或者data.to_csv('路径\文件名') 方法 可以将数据写到一个文件中。

JSON数据: (字典数据结构)"'  {键:值}"'

json is python embeded library , we could import json direclty

"""
import pandas as pd
import json
obj='''
{
"name":"Wes",
"place_lived":["united states","spain","Germany"],
"pet":null,
"siblings":[{"name":"scott","age":30,"pets":["Zeus","Zuko"]},
            {"name":"Katie","age": 38,"pets":["sixes","Stache","Cisco"]}]
 
 }
'''
result=json.loads(obj)
print (result)

读取excel 文件

两个方法, pd.read_excel('path/file.xlsx','Sheet1')

读取并赋值给对象frame

fram.to_excel ()方法。(写数据并保存一个excel文件)

frame

SQlite 是内置库可以读取sql 数据库。

pandas 用read_sql函数可以从SQLAlchemy连接读取数据。

[展开全文]

Sereies

series -一组数据 vs DateFrame=二维、多维数据

 注意:Series 的首字母大写, 表示小写的series

DateFrame:

字典: {索引:值} 

列表:【'a','b','c'】

如果数组很大。 可以用frame.head()来显示前5列(默认,当然, 括号里可以填写数字,表示显示前几列。

也可以通过调整column的位置来调整列的顺序。使用pd.DataFrame(data, columns=['year','state','pop']) 本例子中交换了'year' 和'state' column.

上图,pd.DataFrame 定义了一个debt 列,但是没有赋值,这样系统就默认赋一个空值NaN

也可以直接查询数组的columns 来得到二维数组的表头名。

要想获取dataframe的一个列,可以用也可以用【‘列名’】

切片

给某一列赋值可以用frame['列名']=16.5 ,也可以用=np.arrange(6) 函数赋一个序列。

注意要先import numpy as np ,另外,arange(6)是1~6是整型, 如果是arange(6.)则表示浮点型。

用frame.T 来将数组转置

drop()方法可以丢弃某些列

iloc =indexlocation, data.iloc[2<第3 行>,[3,0,1<第4,第1,第2 列>] 实际位置是该数字+1, 如2 代表第2+1行。

重点:frame.sort_index() 和 sort_values()

skipna=false空值排除掉,不参与tong

[展开全文]

python 的重点

  1. 切片,range()
    1. [a:b] 指的是第a+1 到第b个的数组切片,(a+1, b 不变); -1 表示最后一个。如果在b的位置则表示最后一位再-1 位。

    2. range(a,b,c) (从a 开始,到b-1 , c 是步长(可省略))的整数 .(a 不变,b-1)

    3.  

  2. 语法和循环
  3. NumPy and Pandas

NumPy

question ?shape 是什么意思?

array() and arrange() 函数都可以生成数组,唯一区别在于arrange 中的值可以是浮点型,而 array只能是整数。

标量即常数的意思

第一个数组对应的位置的值与第二个数组的相同位置的值比大小, 返回结果为ture or false.

arr[5:8]=12 用12来代替arr 数组中第6~8位的值 

此例子中arr_slice[1] =12345 # 将前一个切片的第二个位置有12345 来替换掉。

给切片赋值(上图)

给数组排序用sort()方法

[展开全文]

列表字典是重点, 元组集合理解即可

注意, list()本身是一个内置的方法名,list变量名要家数字以便于区分。如list1, list2 ...etc

list2[2]='x' # 将字符'x' 替换列表list2 中的第2个元素值。 

sort()函数直接修改列表内元素的顺序。

字典是判断键而不是判断键对应的值是否存在。

集合:(要求:了解)

[展开全文]

注意for , if ..else , while 语句以冒号:结尾

注释用# 来开头

is 是比较两个变量是不是完全一样? == 只是比较两个变量的值是否相同, 所以a=b is true , a is not c (只是值相等,但它们本身是两个不同的变量名)

if 。。elif ..elif ...else

continue--跳出本次循环

break--跳出整个for 循环(break 只中断for循环的最内层,其余的for循环仍会运行)

for语句适合搭配list,tuple , dictionary 等容器中取值使用, while 循环适合搭配if判断与君使用

pass 是占位语句。

要背:

range 参数口决 (a 不变 b-1), (a,b,c, c是步长,默认为1)

切片(参数:a-1, b 不变) 

range 函数常用代码(重要知识点)

不建议大家用三元表达式,可读性较差

 

[展开全文]

注意count 专门由于统计行数

方法前面必须有对象。 所以replace()前必须有对象s4 且中间用点连接。方法的功能类似于函数,但是函数不需要对象. 

\ 在python表示转意 ,即前一个反斜杠告诉计算机后一个反斜杠就时一个字符后

+ 字符拼接用加号(方法一)

s1="this is first half"

s2=" and this is second half"

s1+s2

out : "this is first half and this is second half"

 

字符串拼接方法二 用双冒号::

用逗号字符替换双冒号字符。

None 既是数值也是一种类型 注意N大写是值, 小写n , 系统认为是为定义的变量名none 而报错。

 

[展开全文]

numpy , pandas 要重点学80% 精力

【暗坑】安装时要,勾选

[展开全文]

level 1--主要学习编程

level2 -主要学习金融知识

level3 --数据挖掘

代码:1抄2改3造

[展开全文]

授课教师

高级讲师

课程特色

视频(80)
下载资料(2)
考试(2)