04-01 用電腦來學習¶

今天我們會簡單介紹 Python 在算數學的時候, 可以用到的一些基本工具。做這個的目的, 除了介紹基本工具, 更重要的是希望大家知道, 「你一定要去寫有意思的程式, 你才有興趣寫下去。」

也就是, 「你要覺得好玩才可以。」也許是我們同學太優秀, 所以似乎不太會找好玩的問題。

另一方面, 如果我們要學的東西就是, 嗯, 什麼貝式統計啦, 假設檢定啦, information theory 啦, 或其他任何有點深奧生硬的主題, 要怎麼辦呢? 一個很好的方法, 就是用 Python 寫程式來幫你學習!

很能代表這樣精神的, 就是 Allen Downey 教授, 他學什麼都寫成程式。他以前是寫 Java 的, 有本很出名的書叫 "How To Think Like a Computer Scientist", 第一版用的是 Java。之後有人覺得這本書太有意思, 和他合寫 Python 版, 然後他的主力程式語言就變成 Python 了!

【Allen Downey 免費的書下載】

另一個很好的例子是 Mosky, 她是台科大資料系出身, 近來非常認真的唸數學和統計學, 她的

【Hypothesis Testing with Python】

就是很好的「用電腦學習」的範例。

04-02 進入 array 導向的程式設計¶

數據分析最重要的概念, 大概是「不到最後關頭, 絕不輕言使用迴圈」。

In [1]:

%matplotlib inline

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

有一班同學成績是這樣的:

grades = [35, 74, 43, 66, 87, 55, 71, 65]

老師想要每位同學成績都是乘 1.1 倍!

In [2]:

grades = [35, 74, 43, 66, 87, 55, 71, 65]

In [3]:

curved = []

for g in grades:
    curved.append(g*1.1)

In [4]:

curved

Out[4]:

[38.5,
 81.4,
 47.300000000000004,
 72.60000000000001,
 95.7,
 60.50000000000001,
 78.10000000000001,
 71.5]

或許再加個 3 分, 於是又...

In [5]:

curved2 = []

for g in curved:
    curved2.append(g + 4)

In [6]:

curved2

Out[6]:

[42.5,
 85.4,
 51.300000000000004,
 76.60000000000001,
 99.7,
 64.5,
 82.10000000000001,
 75.5]

換成 array, 又快又自然!

In [7]:

grad_arr = np.array(grades)

In [8]:

grad_arr

Out[8]:

array([35, 74, 43, 66, 87, 55, 71, 65])

In [9]:

grad_arr * 1.1

Out[9]:

array([38.5, 81.4, 47.3, 72.6, 95.7, 60.5, 78.1, 71.5])

看來還是再加個 3 分...

In [10]:

grad_arr * 1.1 + 4

Out[10]:

array([42.5, 85.4, 51.3, 76.6, 99.7, 64.5, 82.1, 75.5])

這個就叫 "broadcasting!"¶

04-03 Broadcasting 比我們想像更有趣¶

一位老師成績這樣算的:

平時成績 20%
期中考 35%
期未考 45%

有位同學

平時成績 85 分
期中 70 分
期末 80 分

這位同學的學期成績是多少?

In [11]:

grades = np.array([85, 70, 80])
weights = np.array([0.2, 0.35, 0.45])

In [12]:

wgrades = grades * weights

In [13]:

wgrades

Out[13]:

array([17. , 24.5, 36. ])

In [14]:

wgrades.sum()

Out[14]:

77.5

我們其實可以用 dot product (矩陣乘法) 算出來!

In [15]:

grades @ weights

Out[15]:

77.5

很多同學一起來...

In [16]:

grades = np.array([[85, 70, 80],
                 [12, 88, 77],
                 [85, 91, 33]])

In [17]:

grades * weights

Out[17]:

array([[17.  , 24.5 , 36.  ],
       [ 2.4 , 30.8 , 34.65],
       [17.  , 31.85, 14.85]])

軸的概念!

In [18]:

wgrades = grades * weights

In [19]:

wgrades

Out[19]:

array([[17.  , 24.5 , 36.  ],
       [ 2.4 , 30.8 , 34.65],
       [17.  , 31.85, 14.85]])

In [20]:

wgrades.sum(axis=1)

Out[20]:

array([77.5 , 67.85, 63.7 ])

當然我這麼算有點誤導大家...

In [21]:

grades @ weights

Out[21]:

array([77.5 , 67.85, 63.7 ])

我把它弄成「正確的矩陣」呢?

In [22]:

weights.shape

Out[22]:

(3,)

In [23]:

weights.reshape(3,1)

Out[23]:

array([[0.2 ],
       [0.35],
       [0.45]])

In [24]:

grades @ weights.reshape(3,1)

Out[24]:

array([[77.5 ],
       [67.85],
       [63.7 ]])

04-04 重要的 array 大變身¶

我們在數據分析, 常常要改 array 的型式。

[練習] 一個 50 個數字的 array¶

先想辦法、用亂數做出 50 個數字的 array, 叫做 A 好了。

In [25]:

A = np.random.randint(0, 10, 50)

In [26]:

Out[26]:

array([8, 9, 5, 2, 0, 7, 4, 1, 3, 7, 1, 9, 5, 4, 9, 3, 5, 9, 7, 9, 6, 5,
       6, 7, 2, 9, 2, 9, 1, 6, 9, 6, 0, 7, 5, 1, 5, 7, 7, 8, 1, 4, 9, 9,
       8, 3, 7, 2, 5, 3])

檢查 A 的 shape¶

In [27]:

A.shape

Out[27]:

(50,)

更改 A 的 shape¶

In [28]:

A.shape = (5,10)

In [29]:

Out[29]:

array([[8, 9, 5, 2, 0, 7, 4, 1, 3, 7],
       [1, 9, 5, 4, 9, 3, 5, 9, 7, 9],
       [6, 5, 6, 7, 2, 9, 2, 9, 1, 6],
       [9, 6, 0, 7, 5, 1, 5, 7, 7, 8],
       [1, 4, 9, 9, 8, 3, 7, 2, 5, 3]])

但用 reshape 其實是比較好的方式...

In [30]:

A.reshape(10,5)

Out[30]:

array([[8, 9, 5, 2, 0],
       [7, 4, 1, 3, 7],
       [1, 9, 5, 4, 9],
       [3, 5, 9, 7, 9],
       [6, 5, 6, 7, 2],
       [9, 2, 9, 1, 6],
       [9, 6, 0, 7, 5],
       [1, 5, 7, 7, 8],
       [1, 4, 9, 9, 8],
       [3, 7, 2, 5, 3]])

In [31]:

Out[31]:

array([[8, 9, 5, 2, 0, 7, 4, 1, 3, 7],
       [1, 9, 5, 4, 9, 3, 5, 9, 7, 9],
       [6, 5, 6, 7, 2, 9, 2, 9, 1, 6],
       [9, 6, 0, 7, 5, 1, 5, 7, 7, 8],
       [1, 4, 9, 9, 8, 3, 7, 2, 5, 3]])

In [32]:

A = A.reshape(10, 5)

In [33]:

Out[33]:

array([[8, 9, 5, 2, 0],
       [7, 4, 1, 3, 7],
       [1, 9, 5, 4, 9],
       [3, 5, 9, 7, 9],
       [6, 5, 6, 7, 2],
       [9, 2, 9, 1, 6],
       [9, 6, 0, 7, 5],
       [1, 5, 7, 7, 8],
       [1, 4, 9, 9, 8],
       [3, 7, 2, 5, 3]])

拉回成一條向量...¶

In [34]:

A.ravel()

Out[34]:

array([8, 9, 5, 2, 0, 7, 4, 1, 3, 7, 1, 9, 5, 4, 9, 3, 5, 9, 7, 9, 6, 5,
       6, 7, 2, 9, 2, 9, 1, 6, 9, 6, 0, 7, 5, 1, 5, 7, 7, 8, 1, 4, 9, 9,
       8, 3, 7, 2, 5, 3])

In [35]:

Out[35]:

array([[8, 9, 5, 2, 0],
       [7, 4, 1, 3, 7],
       [1, 9, 5, 4, 9],
       [3, 5, 9, 7, 9],
       [6, 5, 6, 7, 2],
       [9, 2, 9, 1, 6],
       [9, 6, 0, 7, 5],
       [1, 5, 7, 7, 8],
       [1, 4, 9, 9, 8],
       [3, 7, 2, 5, 3]])

快速 array 生成法¶

In [36]:

np.zeros(10)

Out[36]:

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [37]:

np.zeros((3,4))

Out[37]:

array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

In [38]:

np.eye(5)

Out[38]:

array([[1., 0., 0., 0., 0.],
       [0., 1., 0., 0., 0.],
       [0., 0., 1., 0., 0.],
       [0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 1.]])

In [39]:

np.ones((8,7))

Out[39]:

array([[1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1.]])

In [40]:

np.diag((1, 2, 3))

Out[40]:

array([[1, 0, 0],
       [0, 2, 0],
       [0, 0, 3]])

很有趣的是...

In [41]:

A = np.array([[1, 2, 3],
             [4, 5, 6],
             [7, 8, 9]])

In [42]:

Out[42]:

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [43]:

np.diag(A)

Out[43]:

array([1, 5, 9])

04-05 array 過濾器¶

array 有個很有趣的用法...

In [44]:

L = np.array([3, -2, -1, 5, 7, -3])

我們用另一個 array, 把「要的」標 True, 不要的標 False

In [45]:

want = np.array([True, False, False, True, True, False])

也就是我們只要正的...

In [46]:

L[want]

Out[46]:

array([3, 5, 7])

其實我們可以這樣做...

In [47]:

L>0

Out[47]:

array([ True, False, False,  True,  True, False])

In [48]:

L[L>0]

Out[48]:

array([3, 5, 7])

In [49]:

a = np.array([1, 2, 3])

In [50]:

a.shape

Out[50]:

(3,)

In [51]:

a.shape = (1,3)

In [52]:

L = np.array([3, -2, -1, 5, 7, -3, 87])

In [53]:

Out[53]:

array([ 3, -2, -1,  5,  7, -3, 87])

In [54]:

L>0

Out[54]:

array([ True, False, False,  True,  True, False,  True])

In [55]:

L<10

Out[55]:

array([ True,  True,  True,  True,  True,  True, False])

In [56]:

(L>0) & (L<10)

Out[56]:

array([ True, False, False,  True,  True, False, False])

In [57]:

L[(L>0) & (L<10)]

Out[57]:

array([3, 5, 7])

[練習] 畫個函數 (如 sinc), 標出正的部份!¶¶

In [58]:

x = np.linspace(-5, 5, 1000)
y = np.sinc(x)

plt.plot(x,y,lw=6)
plt.plot(x[y>0] , y[y>0], 'o')

Out[58]:

[<matplotlib.lines.Line2D at 0x11c652438>]

04-06 像上數學課一樣算數學!¶

In [59]:

import sympy as sym

In [60]:

1/2 + 1/3

Out[60]:

0.8333333333333333

In [61]:

sym.Rational(1, 2) + sym.Rational(1, 3)

Out[61]:

5/6

先來變美一點...

In [62]:

sym.init_printing()

In [63]:

sym.Rational(1, 2)  + sym.Rational(1, 3)

Out[63]:

$$\frac{5}{6}$$

更方便的做法 -- sympify

In [64]:

sym.S(1)/2 + sym.S(1)/3

Out[64]:

$$\frac{5}{6}$$

這太常用了, 所以我們讀進來...

In [65]:

from sympy import S, N

In [66]:

S(1)/2 + S(1)/3

Out[66]:

$$\frac{5}{6}$$

In [67]:

sym.pi

Out[67]:

$$\pi$$

In [68]:

π = sym.pi

In [69]:

π

Out[69]:

$$\pi$$

In [70]:

N(π, 20)

Out[70]:

$$3.1415926535897932385$$

In [71]:

N(π, 10000)

Out[71]:

$$3.141592653589793238462643383279502884197169399375105820974944592307816406286208998628034825342117067982148086513282306647093844609550582231725359408128481117450284102701938521105559644622948954930381964428810975665933446128475648233786783165271201909145648566923460348610454326648213393607260249141273724587006606315588174881520920962829254091715364367892590360011330530548820466521384146951941511609433057270365759591953092186117381932611793105118548074462379962749567351885752724891227938183011949129833673362440656643086021394946395224737190702179860943702770539217176293176752384674818467669405132000568127145263560827785771342757789609173637178721468440901224953430146549585371050792279689258923542019956112129021960864034418159813629774771309960518707211349999998372978049951059731732816096318595024459455346908302642522308253344685035261931188171010003137838752886587533208381420617177669147303598253490428755468731159562863882353787593751957781857780532171226806613001927876611195909216420198938095257201065485863278865936153381827968230301952035301852968995773622599413891249721775283479131515574857242454150695950829533116861727855889075098381754637464939319255060400927701671139009848824012858361603563707660104710181942955596198946767837449448255379774726847104047534646208046684259069491293313677028989152104752162056966024058038150193511253382430035587640247496473263914199272604269922796782354781636009341721641219924586315030286182974555706749838505494588586926995690927210797509302955321165344987202755960236480665499119881834797753566369807426542527862551818417574672890977772793800081647060016145249192173217214772350141441973568548161361157352552133475741849468438523323907394143334547762416862518983569485562099219222184272550254256887671790494601653466804988627232791786085784383827967976681454100953883786360950680064225125205117392984896084128488626945604241965285022210661186306744278622039194945047123713786960956364371917287467764657573962413890865832645995813390478027590099465764078951269468398352595709825822620522489407726719478268482601476990902640136394437455305068203496252451749399651431429809190659250937221696461515709858387410597885959772975498930161753928468138268683868942774155991855925245953959431049972524680845987273644695848653836736222626099124608051243884390451244136549762780797715691435997700129616089441694868555848406353422072225828488648158456028506016842739452267467678895252138522549954666727823986456596116354886230577456498035593634568174324112515076069479451096596094025228879710893145669136867228748940560101503308617928680920874760917824938589009714909675985261365549781893129784821682998948722658804857564014270477555132379641451523746234364542858444795265867821051141354735739523113427166102135969536231442952484937187110145765403590279934403742007310578539062198387447808478489683321445713868751943506430218453191048481005370614680674919278191197939952061419663428754440643745123718192179998391015919561814675142691239748940907186494231961567945208095146550225231603881930142093762137855956638937787083039069792077346722182562599661501421503068038447734549202605414665925201497442850732518666002132434088190710486331734649651453905796268561005508106658796998163574736384052571459102897064140110971206280439039759515677157700420337869936007230558763176359421873125147120532928191826186125867321579198414848829164470609575270695722091756711672291098169091528017350671274858322287183520935396572512108357915136988209144421006751033467110314126711136990865851639831501970165151168517143765761835155650884909989859982387345528331635507647918535893226185489632132933089857064204675259070915481416549859461637180270981994309924488957571282890592323326097299712084433573265489382391193259746366730583604142813883032038249037589852437441702913276561809377344403070746921120191302033038019762110110044929321516084244485963766983895228684783123552658213144957685726243344189303968642624341077322697802807318915441101044682325271620105265227211166039666557309254711055785376346682065310989652691862056476931257058635662018558100729360659876486117910453348850346113657686753249441668039626579787718556084552965412665408530614344431858676975145661406800700237877659134401712749470420562230538994561314071127000407854733269939081454664645880797270826683063432858785698305235808933065757406795457163775254202114955761581400250126228594130216471550979259230990796547376125517656751357517829666454779174501129961489030463994713296210734043751895735961458901938971311179042978285647503203198691514028708085990480109412147221317947647772622414254854540332157185306142288137585043063321751829798662237172159160771669254748738986654949450114654062843366393790039769265672146385306736096571209180763832716641627488880078692560290228472104031721186082041900042296617119637792133757511495950156604963186294726547364252308177036751590673502350728354056704038674351362222477158915049530984448933309634087807693259939780541934144737744184263129860809988868741326047215695162396586457302163159819319516735381297416772947867242292465436680098067692823828068996400482435403701416314965897940924323789690706977942236250822168895738379862300159377647165122893578601588161755782973523344604281512627203734314653197777416031990665541876397929334419521541341899485444734567383162499341913181480927777103863877343177207545654532207770921201905166096280490926360197598828161332316663652861932668633606273567630354477628035045077723554710585954870279081435624014517180624643626794561275318134078330336254232783944975382437205835311477119926063813346776879695970309833913077109870408591337464144282277263465947047458784778720192771528073176790770715721344473060570073349243693113835049316312840425121925651798069411352801314701304781643788518529092854520116583934196562134914341595625865865570552690496520985803385072242648293972858478316305777756068887644624824685792603953527734803048029005876075825104747091643961362676044925627420420832085661190625454337213153595845068772460290161876679524061634252257719542916299193064553779914037340432875262888963995879475729174642635745525407909145135711136941091193932519107602082520261879853188770584297259167781314969900901921169717372784768472686084900337702424291651300500516832336435038951702989392233451722013812806965011784408745196012122859937162313017114448464090389064495444006198690754851602632750529834918740786680881833851022833450850486082503930213321971551843063545500766828294930413776552793975175461395398468339363830474611996653858153842056853386218672523340283087112328278921250771262946322956398989893582116745627010218356462201349671518819097303811980049734072396103685406643193950979019069963955245300545058068550195673022921913933918568034490398205955100226353536192041994745538593810234395544959778377902374216172711172364343543947822181852862408514006660443325888569867054315470696574745855033232334210730154594051655379068662733379958511562578432298827372319898757141595781119635833005940873068121602876496286744604774649159950549737425626901049037781986835938146574126804925648798556145372347867330390468838343634655379498641927056387293174872332083760112302991136793862708943879936201629515413371424892830722012690147546684765357616477379467520049075715552781965362132392640616013635815590742202020318727760527721900556148425551879253034351398442532234157623361064250639049750086562710953591946589751413103482276930624743536325691607815478181152843667957061108615331504452127473924544945423682886061340841486377670096120715124914043027253860764823634143346235189757664521641376796903149501910857598442391986291642193994907236234646844117394032659184044378051333894525742399508296591228508555821572503107125701266830240292952522011872676756220415420516184163484756516999811614101002996078386909291603028840026910414079288621507842451670908700069928212066041837180653556725253256753286129104248776182582976515795984703562226293486003415872298053498965022629174878820273420922224533985626476691490556284250391275771028402799806636582548892648802545661017296702664076559042909945681506526530537182941270336931378517860904070866711496558343434769338578171138645587367812301458768712660348913909562009939361031029161615288138437909904231747336394804575931493140529763475748119356709110137751721008031559024853090669203767192203322909433467685142214477379393751703443661991040337511173547191855046449026365512816228824462575916333039107225383742182140883508657391771509682887478265699599574490661758344137522397096834080053559849175417381883999446974867626551658276584835884531427756879002909517028352971634456212964043523117600665101241200659755851276178583829204197484423608007193045761893234922927965019875187212726750798125547095890455635792122103334669749923563025494780249011419521238281530911407907386025152274299581807247162591668545133312394804947079119153267343028244186041426363954800044800267049624820179289647669758318327131425170296923488962766844032326092752496035799646925650493681836090032380929345958897069536534940603402166544375589004563288225054525564056448246515187547119621844396582533754388569094113031509526179378002974120766514793942590298969594699556576121865619673378623625612521632086286922210327488921865436480229678070576561514463204692790682120738837781423356282360896320806822246801224826117718589638140918390367367222088832151375560037279839400415297002878307667094447456013455641725437090697939612257142989467154357846878861444581231459357198492252847160504922124247014121478057345510500801908699603302763478708108175450119307141223390866393833952942578690507643100638351983438934159613185434754649556978103829309716465143840700707360411237359984345225161050702705623526601276484830840761183013052793205427462865403603674532865105706587488225698157936789766974220575059683440869735020141020672358502007245225632651341055924019027421624843914035998953539459094407046912091409387001264560016237428802109276457931065792295524988727584610126483699989225695968815920560010165525637567$$

什麼都在 π 中出現過...

In [72]:

pistring = str(N(π, 100000))

In [73]:

'1215' in pistring

Out[73]:

True

In [74]:

'9487' in pistring

Out[74]:

True

In [75]:

pistring.find('1215')

Out[75]:

$$11942$$

In [76]:

pistring[11942:11946]

Out[76]:

'1215'

04-07 質數¶

In [77]:

a = 9487

In [78]:

sym.isprime(a)

Out[78]:

False

In [79]:

sym.factorint(9487)

Out[79]:

$$\left \{ 53 : 1, \quad 179 : 1\right \}$$

In [80]:

53*179

Out[80]:

$$9487$$

In [81]:

sym.isprime(179)

Out[81]:

True

In [82]:

sym.prime(87)

Out[82]:

$$449$$

In [83]:

sym.nextprime(449)

Out[83]:

$$457$$

In [84]:

for i in range(2, 50):
    a = sym.prime(i)
    b = sym.prime(i+1)
    if b-a == 2:
        print(f'{a} 和 {b} 是孿生質數!')

3 和 5 是孿生質數!
5 和 7 是孿生質數!
11 和 13 是孿生質數!
17 和 19 是孿生質數!
29 和 31 是孿生質數!
41 和 43 是孿生質數!
59 和 61 是孿生質數!
71 和 73 是孿生質數!
101 和 103 是孿生質數!
107 和 109 是孿生質數!
137 和 139 是孿生質數!
149 和 151 是孿生質數!
179 和 181 是孿生質數!
191 和 193 是孿生質數!
197 和 199 是孿生質數!
227 和 229 是孿生質數!

04-08 Sympy 的矩陣¶

In [85]:

A = sym.Matrix([[2, -1, 3],
               [0, 1, 2],
               [-1, 1, 2]])

In [86]:

A.det()

Out[86]:

$$5$$

In [87]:

A.inv()

Out[87]:

$$\left[\begin{matrix}0 & 1 & -1\\- \frac{2}{5} & \frac{7}{5} & - \frac{4}{5}\\\frac{1}{5} & - \frac{1}{5} & \frac{2}{5}\end{matrix}\right]$$

04-09 設定 Sympy 的變數¶

第一式¶

In [88]:

x = sym.Symbol('x')

In [89]:

f = x**2 - 3*x + 2

In [90]:

Out[90]:

$$x^{2} - 3 x + 2$$

In [91]:

sym.diff(f, x)

Out[91]:

$$2 x - 3$$

In [92]:

sym.integrate(f, x)

Out[92]:

$$\frac{x^{3}}{3} - \frac{3 x^{2}}{2} + 2 x$$

In [93]:

g = 5*x**2 - 3*x + 9

In [94]:

f + g

Out[94]:

$$6 x^{2} - 6 x + 11$$

In [95]:

f * g

Out[95]:

$$\left(x^{2} - 3 x + 2\right) \left(5 x^{2} - 3 x + 9\right)$$

In [96]:

h = 3*k**2 - 3*k + 2

--------------------------------------------------------------------
NameError                          Traceback (most recent call last)
<ipython-input-96-0b3b22298560> in <module>()
----> 1 h = 3*k**2 - 3*k + 2

NameError: name 'k' is not defined

第二式¶

In [97]:

from sympy.abc import x, y, z

In [98]:

f = sym.atan(x)

In [99]:

sym.diff(f, x)

Out[99]:

$$\frac{1}{x^{2} + 1}$$

In [100]:

sym.integrate(f, x)

Out[100]:

$$x \operatorname{atan}{\left (x \right )} - \frac{1}{2} \log{\left (x^{2} + 1 \right )}$$

In [101]:

sym.integrate(f, (x, 0, 1))

Out[101]:

$$- \frac{1}{2} \log{\left (2 \right )} + \frac{\pi}{4}$$

【下期預告】熊貓終於是來了¶

In [102]:

import pandas as pd

In [103]:

df = pd.read_csv('http://stats.moe.gov.tw/files/detail/107/107_student.csv')

In [104]:

df.head()

Out[104]:

	學校代碼	學校名稱	日間∕進修別	等級別	一年級男生	一年級女生	二年級男生	二年級女生	三年級男生	三年級女生	...	五年級男生	五年級女生	六年級男生	六年級女生	七年級男生	七年級女生	延修生男生	延修生女生	縣市名稱	體系別
0	1	國立政治大學	D 日	D 博士	96	85	82	78	93	59	...	71	52	58	46	74	40	-	-	30 臺北市	1 一般
1	1	國立政治大學	D 日	M 碩士	624	742	632	695	348	431	...	-	-	-	-	-	-	-	-	30 臺北市	1 一般
2	1	國立政治大學	D 日	B 學士	899	1,287	890	1,332	878	1,325	...	-	-	-	-	-	-	326	463	30 臺北市	1 一般
3	1	國立政治大學	N 職	M 碩士	303	248	253	259	201	210	...	53	47	-	-	-	-	-	-	30 臺北市	1 一般
4	2	國立清華大學	D 日	D 博士	225	99	201	71	189	73	...	158	50	112	43	168	58	-	-	18 新竹市	1 一般

5 rows × 22 columns

如果我們要算日間部, 用大學部一年級同學計算, 什麼學校女生比男生比例是最高的 (或男生比女生比例最高), 前 20 名要怎麼做呢?