#!/usr/bin/env python # coding: utf-8 # # Programmierung in Python # # **Univ.-Prof. Dr. Martin Hepp,** Universität der Bundeswehr München #

# # ## Einheit 1: Erste Schritte in Python # **Version: 2020-02-05** #

# [**http://www.ebusiness-unibw.org/wiki/Teaching/PIP**](http://www.ebusiness-unibw.org/wiki/Teaching/PIP) # ## Syntaktische Konventionen # # ### Keine Zeilenummern # **Ohne Zeilennummern:
** # (Python etc.) # ```python # a = 1 # b = 2 # print(a) # ``` # **Mit Zeilennummern:
** # (nur in älteren Sprachen) # ``` # 10 a = 1 # 20 b = 2 # 30 print(a)``` # ### Groß-/Kleinschreibung # Groß-/Kleinschreibung muss beachtet werden: # ```python # a = 10 # die Variable a wird definiert # print(A) # die Variable A gibt es aber nicht # ``` # ### Reservierte Namen # Namen, die für Befehle etc. verwendet werden, dürfen nicht als Namen für Werte oder Objekte genutzt werden. # # Es gibt # - **Schlüsselwörter** für echte Sprachelemente ("keywords") # und # - **Namen für vordefinierte Objekte und Methoden** ("Built-ins"). # **Schlüsselwörter für echte Sprachelemente ("keywords")** # In[2]: help('keywords') # **Namen für vordefinierte Objekte und Methoden ("Built-ins")** # In[57]: import builtins seq = list(dir(builtins)) seq.sort() max_len = len(max(seq, key=len)) chunks = [seq[pos:pos + 4] for pos in range(0, len(seq), 4)] for chunk in chunks: print("".join([item.ljust(max_len + 1) for item in chunk])) # ### Zuweisungs- und Vergleichsoperator # Die meisten Programmiersprachen unterscheiden zwischen # - **Zuweisung** ("a soll den Wert 5 erhalten") # und # - **Vergleich** ("Entspricht a dem Wert 5?") # von Werten und Ausdrücken. # In[3]: # Python # Zuweisung a = 5 # Vergleich # Entspricht a dem Wert 5? print(a == 5) # ## Stil und Formatierung # ### Namen # Namen für Werte (in anderen Programmiersprachen "Variablen") sollten aussagekräftig und ohne Umlaute gewählt werden. # ```python # dauer = 5 # zins = 0.01``` # Wenn der Name aus mehreren Wörtern besteht, werden diese durch einen Unterstrich (\_) verbunden: # ```python # dauer_in_jahren = 5``` # # Variablennamen sollten stets in **Kleinbuchstaben** sein. # Für Konstanten verwendet man dagegen Namen in Großbuchstaben: # ```python # PI = 3.1415 # ABSOLUTER_NULLPUNKT = -273.15 # Grad Celsius``` # ### Leerzeichen # Vor und nach Operanden wie + oder - gehört jeweils ein Leerzeichen: # In[ ]: zins = 1 + 0.02 # Unnötige Einrückungen sind nicht erlaubt: # In[ ]: zins = 1 + 0.02 zinseszins = guthaben * (1 + zins)**4 # **Stilistische Konventionen** # # - Keine sonstigen unnötigen Leerzeichen, besonders nicht am Zeilenende. # - Unnötige Leerzeilen nur sparsam verwenden. # - Es gibt noch weitere stilistische Konventionen: # - [PEP 8](https://www.python.org/dev/peps/pep-0008/) # - [Google Python Styleguide](http://google.github.io/styleguide/pyguide.html) # ## Grundlegende Datenstrukturen # # - Alles in Python ist genaugenommen ein Objekt - jeder Wert, jedes Unterprogramm etc. # # - Alle Objekte, also auch Werte liegen irgendwo im Arbeitsspeicher des Computers. # # - Die Position nennt man die **Adresse**. Sie entspricht der Nummer der Speicherzelle, an der die Daten abgelegt sind, die das Objekt repräsentieren. # ### Namen und Objekte # #### Alles in Python ist ein Objekt # - Objekte können, müssen aber keinen Namen haben. # ```python # print("Hallo Welt") # print(42)``` # - Hier haben die Zeichenfolge "Hallo Welt" und die Zahl 42 keinen Namen, sind aber trotzdem Objekte mit einer Adresse. # Die Adresse eines Objektes im Speicher kann man mit der Funktion `id(name)` zeigen: # In[4]: print(type("Hallo Welt"), type(42)) print(id("Hallo Welt"), id(42)) # - `str` und `int` sind die Typen der Objekte # - str/String = Zeichenkette und int/Integer = Ganzzahl # - Die Zahlen darunter sind die Adressen des Objektes. # #### Objekte _können_ Namen haben # In[5]: mein_text = "Hallo Welt" meine_zahl = 42 # Diese Namen verweisen auf die **Adresse** des Objektes: # In[117]: print(id(mein_text)) print(id(meine_zahl)) # Das ist ein wesentlicher Unterschied zu anderen Programmiersprachen. # In Python führt eine Anweisung wie # ```python # variable = 1234``` # nicht dazu, dass eine Variable ***erzeugt*** wird, die mit dem Wert 1234 ***initial gefüllt*** wird. # Stattdessen wird geprüft, ob es das Objekt der Zahl 1234 schon gibt. Falls nicht, wird eines im Speicher erzeugt. # Dann wird die Adresse dieses Objektes als Verweis dem Namen `variable` zugewiesen, also damit verbunden. # # Der Name `variable` wird also mit dem Objekt/Wert verbunden. # # [\[vgl. Fredrik Lundh: Call by Object\]](http://effbot.org/zone/call-by-object.htm) # Mehrere Anweisungen wie # ```python # zahl_1 = 42 # zahl_2 = 42 # zahl_3 = 42 # ``` # führen in der Regel (*) daher nicht dazu, dass drei Variablen erzeugt werden, # sondern dass drei Namen definiert werden, über die man die Ganzzahl 42 ansprechen kann. # # (*) Im Detail hängt das davon ab, ob Python schnell feststellen kann, ob es diesen Wert schon im Speicher gibt. # #### Mehrfachzuweisung # Man kann übrigens auch in einer Anweisung mehrere Namen für ein und dasselbe Objekt definieren: # In[7]: a = b = c = 3 # **Verständnischeck:** # Wenn wir nun # ```python # b = 4``` # ausführen, was passiert? # In[8]: a = b = c = 3 print(a, b, c) b = 4 print(a, b, c) # Nur der Wert von `b` ändert sich, weil die Verweise der anderen Namen nicht berührt werden. # ### Mutable und Immutable Objects # Es gibt in Python Objekte, # - die man verändern kann (**"Mutable Objects"**), und # - solche, die unveränderlich sind (**"Immutable Objects"**). # # Zahlen und Zeichenketten sind unveränderlich. # Das heißt aber nicht, dass man den Wert von Variablen dieser Typen nicht ändern könnte: # In[9]: text = "Uni" print(text) text = "FH" print(text) # In[10]: zahl = 1 print(zahl) zahl = zahl + 1 print(zahl) # Hier wird jeweils nicht die Variable mit einem neuen **Wert** überschrieben, sondern der neue Wert als neues Objekt erzeugt und die Variable (der Name) **mit der Adresse des neuen Objektes verbunden.** # ### Ausgabe mit `print` # Man kann den Wert jeder Variable und jeden mathematischen Ausdruck mit dem Befehl `print()` auf dem Bildschirm anzeigen lassen: # In[3]: print(1 + 4) print('Hallo') print('Toll!') # In[1]: # Mehrere Werte werden # durch Kommata getrennt print(1, 5 * 3, 'Hallo', 10.3) # ### Numerische Werte # Numerische Werte, wie # - Zahlen wie 5 oder -1.23 # - Mathematische Konstanten wie $\pi$ oder $e$ # - Unendlich ($\infty/-\infty$) und Not-a-Number # sind die häufigsten Arten von Objekten in den meisten Programmen. # #### Ganze Zahlen # Ganze Zahlen werden in Python durch den Datentyp `int` repräsentiert und können beliebig große Werte annehmen (vgl. [Numeric Types — int, float, complex](https://docs.python.org/3/library/stdtypes.html#typesnumeric)). # In[13]: a = 15 b = -7 c = 240 # Man kann auch eine andere Basis als 10 wählen und dadurch elegant **Binärzahlen** und **Hexadezimalzahlen** erzeugen: # In[14]: # Binärzahlen a = 0b00001111 # Hexadezimalzahlen c = 0xF0 print(a, c) # #### Gleitkommazahlen # Wenn ein übergebener Wert einen Dezimalpunkt oder einen Exponenten enthält, wird daraus in Python ein Objekt vom Typ `float` erzeugt. # In[118]: wert_1 = float(1/3) print(wert_1) print(wert_1 * 3) # In[120]: # Achtung, Genauigkeitprobleme! wert_2 = wert_1 / 10000 print((wert_2 * 10000 * 3)) # Bei einem Python-Objekt vom typ `float` handelt es sich (auf fast jedem Computersystem) um eine Gleitkommazahl mit 64 Bit. # Die Genauigkeit und der Wertebereich entsprechen daher dem, was in anderen Programmiersprachen der Typ `double` bietet. # Man muss dazu wissen, dass Python in den neueren Versionen versucht, die Beschränkungen von Gleitkommazahlen bei der Ausgabe durch geschickte Rundungsregeln zu verbergen. So wird $1/3$ intern als eine Gleitkommazahl mit einer begrenzten Anzahl an Stellen gespeichert. # # Zu den Beschränkungen und Fehlerquellen beim Rechnen mit Gleitkommazahlen vgl. [Floating Point Arithmetic: Issues and Limitations](https://docs.python.org/3/tutorial/floatingpoint.html). # #### Dezimalzahlen # Wenn es wichtig ist, dass Zahlen genau in der gegebenen Genauigkeit gespeichert und verarbeitet werden, sind Dezimalzahlen mit einer festen Stellenzahl besser geeignet. # # Dies betrifft insbesondere Geldbeträge. # # Weitere Informationen: https://docs.python.org/3/library/decimal.html # #### Unendlich ($\infty$) # Der Wert unendlich kann in Python auf zwei Wegen erhalten werden: # In[ ]: positive_infinity = float('inf') negative_infinity = float('-inf') # In[ ]: import math positive_infinity_2 = math.inf negative_infinity2 = -math.inf # #### Not-a-Number (NaN) # Es gibt Operationen, bei denen sich das Ergebnis nicht als reelle Zahl abspeichern lässt. Ferner kann bei der Verarbeitung eigentlich numerischer Werte durch Datenqualitätsprobleme der Fall eintreten, dass einzelne Werte keine Zahlen sind. # Für diesen Fall gibt es einen besonderen Wert, der sich **NaN** für "Not a number" nennt. # Beispiele: # - ${\infty}/{\infty}$ # - Quadratwurzel aus negativen Werten # In[ ]: not_a_number = float('NaN') print(100 * not_a_number) # Der wesentliche Nutzen dieses Wertes besteht darin, dass man die Ungültigkeit einer Berechnung erkennen kann. # **Hinweis:** Es gibt auch einen Datentyp `None`, der immer dann zurückgeliefert wird, wenn eine Operation 'nichts' ergibt. # ### Mathematische Operationen # #### Arithmetische Operationen # In[5]: a = 1 b = 2 c = 3 # In[6]: # Grundrechenarten d = a + b print(d) # In[7]: e = c - a print(e) # In[8]: f = b * e print(f) # In[9]: g = f / b print(g) print(5 / 2) # **Achtung:** Seit Python 3.0 ist die Standard-Division eine Gleitkommadivision, 5 / 2 ist also 2.5. In früheren Versionen wurde wurde standardmäßig eine ganzzahlige Division durchgeführt, also 5/2 = 2 (Rest 1). # #### Potenz # $x^y$ in Python als `x**y` # # In[22]: # Potenzfunktionen h = 2**7 # 2^7 = 128 print(h) # #### Wurzel # Direkt in Python gibt es keine Funktion für die Quadratwurzel, weil man dies einfach als Potenzfunktion mit einem Bruch als Exponenten ausdrücken kann: # $\sqrt{x} = x^\frac{1}{2}$ # # $\sqrt[3]{x} = x^\frac{1}{3}$ # In[2]: # Quadratwurzel a = 16 print(a**(1/2)) print(a**0.5) # Es gibt auch ein spezielles Modul `math` mit zusätzlichen mathematischen Methoden. # In[24]: import math a = 16 print(math.sqrt(a)) # #### Ganzzahlige Division # In[25]: a = 5 b = 2 print(a // b) # #### Divisionsrest (modulo) # - **Tip 1:** Nützlich, um zu prüfen, ob eine Zahl gerade ist. # - **Tip 2:** Auch nützlich, wenn man den Wertebereich einer Zahl begrenzen will. # In[26]: # Modulo / Divisionsrest print(a % b) # ### Umwandlung des Datentyps numerischer Werte # In[27]: # float als int # Was passiert? print(int(3.1)) print(int(3.5)) print(int(3.8)) # In[28]: # int als float print(float(7)) # In[14]: # int als Binärzahl print(bin(255)) zahl_als_binaerzahl = bin(255) print(zahl_als_binaerzahl[2:]) print(type(zahl_als_binaerzahl)) # In[30]: # int als Hexadezimalzahl print(hex(255)) # ### Rundung # Bei der Umwandlung einer Gleitkommazahl in eine Ganzzahl mit `int()`ist die Art der Rundung nicht eindeutig. # #### Runden mit `round()` # # Mit der Funktion `round(, )` kann man mathematisch korrekt runden. # # Wenn keine Stellenanzahl angegeben wird, wird auf die nächste ganze Zahl gerundet. # **Beispiel:** # In[31]: # Runden # round(value[, n]) print(round(3.5)) # Der optionale zweite Parameter gibt an, wieviele Nachkommastellen gewünscht werden: # In[32]: # Wir runden Pi auf drei Stellen nach dem Komma print(round(3.1415926, 3)) # #### Abrunden mit `math.floor()` # Mit der Funktion `math.floor()` kann auf die nächstkleinere ganze Zahl abgerundet werden. # In[64]: import math zahl = 3.8 print(math.floor(zahl)) negative_zahl = -3.8 print(math.floor(negative_zahl)) # #### Aufrunden mit `math.ceil()` # Mit der Funktion `math.ceil()` kann auf die nächstgrößere ganze Zahl aufgerundet werden. # In[65]: import math zahl = 3.8 print(math.ceil(zahl)) negative_zahl = -3.8 print(math.ceil(negative_zahl)) # ### Wahrheitswerte (Boolesche Werte) # Ähnlich wie wir in der elementaren Algebra mit Zahlen arbeiten, kann man in der sogenannten Booleschen Algebra mit den Wahrheitswerten `wahr(true)` und `unwahr(false)` arbeiten. # Als Operatoren stehen uns **AND** (Konjunktion), **OR** (Disjunktion), **XOR** (Kontravalenz) und **NOT** (Negation) zur Verfügung. # Zwei (oder mehr) Boolesche Werte kann man mit den Operatoren AND, OR oder XOR verknüpfen. # Mit NOT kann man einen Booleschen Wert invertieren: # # |a|b|a AND b|a OR b|NOT a|a XOR b| # |:---:|:---:|:-------:|:------:|:-----:|:-------:| # |False|False|False|False|True|False| # |True|False|False|True|False|True| # |False|True|False|True|True|True| # |True|True|True|True|False|False| # # Praktisch relevant ist dies z.B. bei Suchmaschinen # # `"finde alle Bücher, die entweder 'Informatik' oder 'BWL' im Titel enthalten"` # # und bei Bedingungen in Geschäftsprozessen # # `"Kreditkarte_gültig AND Produkt_lieferbar"`. # #### Boolesche Werte und Operatoren in Python # In[15]: # Wahr und Falsch sind vordefinierte Werte # Achtung: Schreibweise! a = True b = False # In[16]: # Logische Operatoren print(a and b) print(a or b) print(not a) # Work-around für XOR print(bool(a) ^ bool(b)) # #### Boolesche Werte lassen sich in Ganzzahlen umwandeln # In[35]: print(int(True)) print(int(False)) # In[36]: # Ziemlich nützlich bei Berechnungen versandkostenpflichtig = True versandkosten = 5.95 nettobetrag = 135.00 bruttobetrag = nettobetrag + versandkosten * versandkostenpflichtig print(bruttobetrag) # ### Vergleichsoperatoren # In einem Programm muss man oft den Wert von Objekten vergleichen, z.B. den Lagerbestand mit einer Mindestmenge. Dazu gibt es sogenannte **Vergleichsoperatoren**. Das Ergebnis ist immer ein Boole'scher Wert, also `True` oder `False`. # In[37]: a = 90 b = 60 c = 60 # In[38]: print(a < b) # In[39]: print(a > b) # In[40]: print(a < a) # In[41]: print(a <= a) # In[42]: print(a >= a) # ### Wertevergleich oder Identitätsvergleich? # Wenn man Ausdrücke oder Objekte vergleicht, muss man sich überlegen, ob man # # 1. den **Wert** der Ausdrücke vergleichen will, # oder # 2. ob geprüft werden soll, ob es sich um **dasselbe Objekt** handelt. # # **Wertevergleich mit `a == b`** # # **Identitätsvergleich mit `a is b`** # **Bei numerischen Ausdrücken gibt es i.d.R. keinen Unterschied:** # In[43]: print(3 * 5 == 15) print(3 * 5 is 15) # Allerdings sollte man sich nicht darauf verlassen, dass derselbe Wert auch durch dasselbe Objekt repräsentiert wird und daher stets Werte vergleichen, wenn man numerische Größen vergleicht, und nicht die Identität der Objekte. # In[44]: # Dito bei Strings a = "Text" b = "Text" print(a == b) print(a is b) # Warum? # **Bei änderbaren Objekten (Mutables) sieht es aber anders aus:** # In[20]: a = [1, 2] b = [1, 2] c = b print(a == b) print(a is b) print(c == b) print(c is b) # Das liegt daran, dass änderbare Objekten im Speicher eigene Plätze einnehmen, weil der Computer ja nicht wissen kann, ob sie immer identisch bleiben. # **Beim Wertevergleich mit == wird automatisch eine Typumwandlung versucht:** # In[46]: print(5 == 5.0) # **Beim Identitätsvergleich sind verschiedene Datentypen verschiedene Objekte, selbst wenn sich ihre Werte umwandeln ließen:** # In[47]: print(5 is 5.0) print(True is 1) # In[48]: # Aber: print(5 is int(5.0)) print(int(True) is 1) print(True is bool(1)) # ### Trigonometrische und sonstige mathematische Funktionen # # Siehe auch https://docs.python.org/3/library/math.html. # In[49]: import math # Pi print(math.pi) # Eulersche Zahl print(math.e) # In[50]: # Quadratwurzel print(math.sqrt(16)) # Sinus print(math.sin(90)) # Cosinus print(math.cos(math.pi)) # Tangens print(math.tan(math.pi)) # Log2 print(math.log2(256)) # ### Komplexe Datentypen # Als komplexe Datentypen bezeichnet man solche, die eine adressierbare Struktur an Unterelementen haben. # - Zeichenketten # # | 0 | 1 | 2 | # | --- | --- | --- | # | W | O | W | # - Listen # - Dictionaries # - Tuples # - Mengen / Sets # - sonstige, auch benutzerdefinierte Objekte # #### Zeichenketten # In[51]: # Zeichenkette my_string_1 = 'UniBwM' my_string_2 = "UniBwM" # In[52]: # Die Wahl zwischen einfachen und doppelten Anführungszeichen erlaubt es elegant, # die jeweils andere Form innerhalb der Zeichenkette zu verwenden: my_string_3 = "Die Abkürzung für unsere Universität lautet 'UniBwM'." my_string_3 = 'Die Abkürzung für unsere Universität lautet "UniBwM".' # In[12]: # Mehrzeilige Zeichenketten erfordern DREI Anführungszeichen: my_long_string_1 = """Herr von Ribbeck auf Ribbeck im Havelland, Ein Birnbaum in seinem Garten stand, Und kam die goldene Herbsteszeit, Und die Birnen leuchteten weit und breit, Da stopfte, wenn’s Mittag vom Thurme scholl, Der von Ribbeck sich beide Taschen voll, Und kam in Pantinen ein Junge daher, So rief er: 'Junge, wist’ ne Beer?' Und kam ein Mädel, so rief er: 'Lütt Dirn' Kumm man röwer, ick hebb’ ne Birn.""" # In[54]: my_long_string_2 = '''Herr von Ribbeck auf Ribbeck im Havelland, Ein Birnbaum in seinem Garten stand, Und kam die goldene Herbsteszeit, Und die Birnen leuchteten weit und breit, Da stopfte, wenn’s Mittag vom Thurme scholl, Der von Ribbeck sich beide Taschen voll, Und kam in Pantinen ein Junge daher, So rief er: "Junge, wist’ ne Beer?" Und kam ein Mädel, so rief er: "Lütt Dirn" Kumm man röwer, ick hebb’ ne Birn.''' # ##### Addition von Zeichenketten # In[21]: my_string_1 = "UniBwM" print('Ich studiere an der ' + my_string_1) # Addition mit einem Nicht-String print('Text 1' + str(5 * 7)) # ##### Multiplikation von Zeichenketten # In[56]: print('ABCD' * 3) # In[57]: # Nützlich z.B. für print('=' * 60) print('Progamm ABCD Version 1.0') print('=' * 60) # **Aber man kann keine Zeichenketten** ***miteinander*** **multiplizieren:** # In[58]: my_string_test = '11' second_string = '2' print(my_string_test * second_string) # ##### Länge ermitteln # In[60]: my_string = "LOTTO" print(len(my_string)) # ##### Sonderzeichen in Zeichenketten (Escaping) # Für eine vollständige Liste siehe z.B. [List of Python Escape sequence characters with examples](https://linuxconfig.org/list-of-python-escape-sequence-characters-with-examples). # In[1]: # Zeilenumbruch print('text\nneue Zeile') # In[2]: # Tabulator print('wert 1\twert2\twert3') # In[3]: # Backslash print('a \\ b') # In[5]: # Anführungszeichen print('Er sagte \'Hallo\'') print("Er sagte \"Hallo\"") # ##### f-Strings (nicht klausurrelevant) # Schon immer gab es in Python die Möglichkeit, Werte in eine Zeichenkette einzubetten und zu formatieren, damit man einen Ergebnisstring nicht aufwändig zusammenfügen muss. # # Seit der Version 3.6 existiert ein [deutlich verbesserter Mechanismus, der sich 'f-Strings'](https://docs.python.org/3/reference/lexical_analysis.html#f-strings) nennt. # # Wenn man vor eine Zeichenkette den Buchstaben 'f' setzt, kann man innerhalb geschweifter Klammern beliebige Python-Ausdrücke einfügen: # **Beispiel für f-Strings:** # Die Ausdrücke innerhalb der geschweiften Klammern werden durch ihren Wert ersetzt. # In[66]: import math name = 'Franz' print(f'Hallo {name}!') print(f'Der Umfang eines Kreises mit dem Radius r=2 ist {math.pi * 2}.') # ##### Formattierung von Werten innerhalb von f-Strings (nicht klausurrelevant) # Man kann die Werte in der Ausgabe auch formattieren. Dazu setzt man hinter den Ausdruck einen Doppelpunkt und dann verschiedene Angaben, wie # - die gesamte Breite in Zeichen **inklusive des Dezimaltrenners** (Punkt oder Komma), # - die Anzahl Nachkommastellen, # - ob fehlende Stellen vor dem Dezimalpunkt mit Leerzeichen, Nullen oder einem anderen Zeichen aufgefüllt werden sollen, sowie # - den Datentyp (oft `f` für eine Gleitkommazahl). # ##### Formattierung von Werten innerhalb von f-Strings (nicht klausurrelevant) # `f'{:.f}'` # # Mit führender Null: # # `f'{:0.f}'` # # [Link zur vollständigen Dokumentation der Formatierungsanweisungen](https://docs.python.org/3/library/string.html#formatspec). # ##### Beispiel # In[69]: print(f'Pi ohne Nachkommastellen: {math.pi:.0f}') print(f'Pi mit zwei Nachkommastellen: {math.pi:.2f}') print(f'Pi mit vier Nachkommastellen: {math.pi:.4f}') # ##### Beispiel # In[94]: a = 3.5678 b = 345.7 # Fünf Stellen Gesamtlänge, eine Nachkommastelle # Fehlende Stellen vor dem Wert werden mit Leerzeichen aufgefüllt. print(f'Wert 1:{a:5.1f} Wert 2:{b:5.1f}') # Dito, aber Auffüllung mit Nullen print(f'Wert 1:{a:05.1f} Wert 2:{b:05.1f}') # ##### Weitere Hilfsfunktionen für Strings # In[122]: # https://docs.python.org/3/library/stdtypes.html text = "UniBwM ist toll" print(text.lower()) print(text.upper()) print(text.split(" ")) # **Aufsplitten mit `.split()`** # In[123]: text_2 = "Der erste Satz. Und nun der zweite Satz." print(text_2.split(".")) # **Whitespace (Leerzeichen etc.) entfernen mit `.strip()`** # In[124]: text_3 = " = Hallo = " print(text_3.strip()) # `endswith()` und `startswith()` für Zeichenketten. # # Mit diesen beiden Funktionen kann man prüfen, ob eine Zeichenkette mit einer Zeichenfolge beginnt oder endet. # In[111]: text = "Universität der Bundeswehr" print(text.startswith('Uni')) print(text.endswith('Bundeswehr')) # #### Listen # Listen sind komplexe Variablen aus mehreren Unterelementen beliebigen Typs. Die Unterelemente können einzeln adressiert und auch geändert werden. # # # In[61]: # Liste my_list = [1, 2, 5, 9] my_list_mixed = [1, True, 'UniBwM'] print(my_list_mixed) # ##### Adressierung von Listenelementen und Listenbereichen # Unterelemente können einzeln adressiert und auch geändert werden. Das Format ist dabei # ``` # [::] # # - Name der Liste # - Index des ersten Listenelements # - Index des ersten Elements, das nicht mehr enthalten sein soll # - Schrittweite (-1 für rückwärts)``` # ##### Einzelnes Listenelement # Listenelemente können einzeln adressiert werden. Das erste Element hat den Index 0. # In[62]: my_list = [1, 2, 5, 9] print(my_list[0]) print(my_list[1]) print(my_list[2]) # **Listenelemente können auch einzeln geändert werden:** # In[63]: my_list_mixed = [1, True, 'UniBwM'] my_list_mixed[2] = 'LMU München' print(my_list_mixed) # ##### Bereiche # Man kann auch Bereiche adressieren. Dazu gibt man den Index des ersten Elements und das erste nicht mehr gewünschte Element an. # # Wenn man einen der beiden Werte wegläßt, wird der Anfang bzw. das Ende der Liste verwendet. # In[5]: my_list = ['one', 'two', 'three', 'four', 'five'] # Alle ab dem zweiten Element print(my_list[1:]) # In[6]: # Alle bis zum zweiten Element print(my_list[:2]) # Alle vom zweiten bis zum dritten Element print(my_list[1:3]) # Alle Elemente ohne die letzten beiden: # In[114]: my_list = ['one', 'two', 'three', 'four', 'five'] print(my_list[:-2]) # #### Bereiche ersetzen # Man kann auch Bereiche einer Liste ändern oder die Liste dadurch verkürzen oder verlängern. # In[97]: my_list = ['one', 'two', 'three', 'four', 'five'] my_list[1:3] = ['zwei', 'drei'] print(my_list) # In[66]: my_list = ['one', 'two', 'three', 'four', 'five'] my_list[0:2] = ['one_and_two'] print(my_list) # **Achtung:** Wenn man einen Listen**BEREICH** ändert, muss man eine **Liste** übergeben. # In[98]: my_list = ['one', 'two', 'three', 'four', 'five'] my_list[0:2] = ['one_and_two'] print(my_list) # Sonst versucht Python, den Wert **als Liste seiner Unterelemente** zu verstehen, zum Beispiel eine Zeichenkette in eine Liste von Buchstaben zu zerlegen. # In[7]: my_list = ['one', 'two', 'three', 'four', 'five'] my_list[0:2] = 'ABC' # ABC ist hier eine Zeichenkette # Python versucht, den übergebenen Wert in Unterlemente zu zerlegen # und diese einzufügen. # Daher werden hier die drei Buchstaben A, B und C als neue Listenelemente # eingefügt. print(my_list) # Wenn man **ein** Listenelement ändert, muss man **ein Element übergeben**: # In[69]: my_list = ['one', 'two', 'three', 'four', 'five'] my_list[2] = 'drei' print(my_list) # Wenn man an einer Position **MEHRERE** neue Elemente einfügen will, # muss man diese Position **als Bereich der Länge 1** adressieren. Das geschieht im folgenden durch # `my_list[2:3]`. # In[70]: my_list = ['one', 'two', 'three', 'four', 'five'] my_list[2:3] = ['drei_a', 'drei_b'] print(my_list) # In[71]: # Sonst würde an dieser Stelle eine Liste als Element eingefügt: my_list = ['one', 'two', 'three', 'four', 'five'] my_list[2] = ['drei_a', 'drei_b'] print(my_list) # #### Schrittweite # Man kann auch eine Schrittweite angeben und damit erreichen, dass nur jedes n-te Element aus der Liste zurückgeliefert wird. # In[100]: my_list = ['one', 'two', 'three', 'four', 'five', 'six'] # Jedes zweite Element zwischen 0 und 4 print(my_list[0:5:2]) # In[103]: # Jedes dritte Element print(my_list[::3]) # **Negative Schrittweite für rückwärts:** # In[8]: my_list = ['one', 'two', 'three', 'four', 'five', 'six'] # Alle Elemente in umgekehrter Reihenfolge print(my_list[::-1]) # ##### Verlängern der Liste mit `append()` # Mit der Funktion `append()` kann man einen Wert am Ende einer Liste hinzufügen. # In[105]: my_list = ['one', 'two'] my_list.append('three') print(my_list) # ##### Erweitern der Liste mit `extend()` # Mit der Funktion `extend()` kann man eine Liste am Ende der Liste hinzufügen. # In[106]: my_list = ['one', 'two'] my_list.extend(['three', 'four']) print(my_list) # #### Kontrollfrage: # Was passiert, wenn Sie der Methode `append()` als Parameter eine **LISTE** übergeben? # In[ ]: my_list = ['one', 'two'] my_list.append(['three', 'four']) # In[74]: print(my_list) # Wie Sie sehen, wird in diesem Fall die Liste `['three', 'four']` als Element an dritter Stelle eingefügt. Das dritte Element ist danach also selbst eine Liste. # #### Kontrollfrage # Was passiert, wenn Sie der Methode `extend()` als Parameter einen einzelnen Wert übergeben? # In[ ]: my_list = ['one', 'two'] my_list.extend('three') # In[75]: print(my_list) # Wie Sie sehen versucht Python, den Wert **als Liste seiner Unterelemente** zu verstehen, zum Beispiel eine Zeichenkette in eine Liste von Buchstaben zu zerlegen. # Wenn eine atomare Variable übergeben wird und diese Zerlegung nicht möglich ist, gibt es eine Fehlermeldung: # In[107]: my_list = ['one', 'two'] my_list.extend(1) print(my_list) # ##### Entfernen von Elementen aus einer Liste # Wenn man ein Element aus einer Liste entfernen möchte, kann man dies über seinen **Wert** mit der Funktion `remove()` erreichen. Wenn stattdessen die **Position** des Elementes bekannt ist, gibt es eine Funktion `pop()`. # In[85]: liste = ['Peter', 'Paul', 'Mary'] liste.remove('Paul') print(liste) # In[87]: liste = ['Peter', 'Paul', 'Mary'] liste.pop(0) print(liste) # `pop()` (ohne Parameter) entfernt das Element am Ende der Liste: # In[115]: liste = ['Peter', 'Paul', 'Mary'] liste.pop() print(liste) # `pop()` mit oder ohne Parameter liefert das entfernte Element als Ergebnis zurück. # In[88]: liste = ['Peter', 'Paul', 'Mary'] print(liste.pop(0)) # **Stapel (Stack) und Last in, first out** # # `pop()` kann man sehr verwenden, um einen Stapel (Stack) zu implementieren oder in anderen Zusammenhängen das [LIFO-Prinzip ("last in, first out")](https://de.wikipedia.org/wiki/Last_In_%E2%80%93_First_Out) anzuwenden. # | Position | Name | # |---|---| # | 2 | Paul | # | 1 | Mary | # | 0 | Peter | # # # `Ein neues Element Linda wird oben auf den Stapel gelegt:` # # | Position | Name | # |---|---| # | **3** | **Linda** | # | 2 | Paul | # | 1 | Mary | # | 0 | Peter | # In[11]: mitarbeiter = ['Peter', 'Mary', 'Paul', 'Linda'] print('Unser Team: '+ str(mitarbeiter)) mitarbeiter.append('Frank') print('Unser Team: '+ str(mitarbeiter)) # Wer zuletzt eingestellt wurde, wird zuerst wieder entlassen. name = mitarbeiter.pop() print('Leider müssen wir ' + str(name) + ' wieder entlassen.') print('Unser Team: '+ str(mitarbeiter)) # ##### Sortieren von Listen # Man kann Listen einfach sortieren. Dazu gibt hat eine Liste die Funktion `sort()`. Sie sortiert die Elemente in der ursprünglichen Liste um. # In[117]: my_list = [1, 6, 5, 3, 2, 4] my_list.sort() print(my_list) woerter_liste = ['Peter', 'Mary', 'Zoe', 'Anton'] woerter_liste.sort() print(woerter_liste) # **Achtung:** `sort()` ist eine Funktion, **die das Objekt verändert.** # Es wird keine sortierte Version zurückgeliefert, **sondern das Objekt am bisherigen Ort sortiert.** # In[28]: meine_liste = [1, 2, 3, 0, 7, 4, 13] print(meine_liste.sort()) # ##### Inverse Sortierfolge # Mit dem Parameter `reverse=True` kann man die Sortierreihenfolge umkehren. # In[79]: my_list = [1, 6, 5, 3, 2, 4] my_list.sort(reverse=True) print(my_list) # Es ist möglich, **Listen mit verschiedenen Datentypen** zu sortieren, sofern für jedes mögliche Wertepaar ein Vergleichsoperator definiert ist. # In[118]: # Gemischte Liste gemischte_liste_1 = [1, 1.5, 2, 7.2] gemischte_liste_1.sort() print(gemischte_liste_1) # Die **Sortierung funktioniert** aber **nicht, wenn** eine Liste Elemente enthält, für die **kein Vergleichsoperator definiert ist.** # In[110]: gemischte_liste_2 = [1, 'Zoe', False] gemischte_liste_2.sort() print(gemischte_liste_2) # ##### Suchen in Listen # In[80]: # Prüfen, ob Element in Liste enthalten my_liste_3 = [1, 4, 9, 7] print(2 in my_liste_3) # In[83]: my_liste_4 = ['Hepp', 'Mueller', 'Meier'] if 'Mueller' in my_liste_4: print('Täter gefunden!') # `index()` liefert die erste Position eines passenden Wertes: # In[84]: my_liste_4 = ['Hepp', 'Mueller', 'Meier'] if 'Mueller' in my_liste_4: print(my_liste_4.index('Mueller')) # #### Tuples # Tuples sind strukturierte Datentypen aus mehreren Elementen. Sie sind Immutables, können also nicht verändert werden. Man kann aber natürlich ein neues Tuples aus geänderten Werten erzeugen. # ##### Beispiele # In[83]: # Tuple my_tuple = (1, 3, 9) my_tuple_mixed = (1, True, 'UniBwM') latitude = 48.0803 longitude = 11.6382 geo_position = (latitude, longitude) # ##### Entpacken eines Tuples in mehrere Zielvariablen # Man kann ein Tupel elegant in seine Bestandteile zerlegen und diese einzelnen Variablen zuweisen. Voraussetzung ist nur, dass auf der linken Seite ebensoviele Variablen genannt werden wie das Tupel Bestandteile hat. # In[14]: geo_position = (48.0803, 11.6382) lat, lon = geo_position print(lat) # In[15]: # Das funktioniert auch # mit anderen komplexen Datentypen text = "ABC" x, y, z = text print(x) # **Auch die Elemente eines Tuples können einzeln adressiert werden:** # In[85]: print(geo_position[0]) # In[16]: print(geo_position[1]) # Die Unterelemente eines Tuples können aber nicht geändert werden: # In[86]: geo_position[0] = 44.123 # #### Dictionaries # Dictionaries sind Datenstrukturen, in denen Paare aus Eigenschaften (Properties) und Werte (Values) gespeichert werden können. Dier Werte können über ihren Namen angesprochen werden: # In[22]: my_dict_empty = {} my_dict_simple = {'name' : 'Martin Hepp'} my_dict = {'name' : 'Martin Hepp', 'fakultaet' : 'WOW', 'geburtsjahr' : 1971} print(my_dict['name']) print(my_dict['fakultaet']) # In[23]: # Elemente können geändert und hinzugefügt werden print(my_dict) my_dict['fakultaet'] = 'INF' print(my_dict) my_dict['lieblingsvorlesung'] = 'Programmierung in Python' print(my_dict) # **Wenn es den Schlüssel ('key') nicht gibt, wird eine Fehlermeldung produziert:** # In[24]: print(my_dict['einkommen']) # **Das kann man mit der Methode `get()` vermeiden:** # In[25]: print(my_dict.get('einkommen')) # **Man kann auch einen Default-Wert vorgeben (normalerweise `None`).** # # Dieser Wert wird zurückgeliefert, wenn es die Eigenschaft bisher nicht gibt. # In[26]: print(my_dict.get('einkommen', 'Unbekannt')) print(my_dict.get('einkommen', 0)) # **Beispiel:** # In[92]: adresse = {} print(adresse) # In[93]: adresse = {} adresse['plz'] = '85577' print(adresse['plz']) adresse['sonderfeld'] = 'Bemerkungen bitte hier' print(adresse) # **Liste von Dictionaries:** # In[94]: gast_1 = {'name' : 'Frank Farian'} gast_2 = {'name' : 'Lady Gaga'} gast_3 = {'name' : 'John Lennon'} gaesteliste = [] gaesteliste.append(gast_1) gaesteliste.append(gast_2) gaesteliste.append(gast_3) gast_2['bemerkung'] = 'Supercool!' print(gaesteliste) # In[95]: for gast in gaesteliste: print(gast['name'], gast.get('bemerkung', '')) # In[96]: gast_2['bemerkung'] = 'Supercool!' print(gaesteliste) # #### Sets (Mengen) # In[97]: a = set(['rot', 'gruen', 'blau', 'gelb']) print(a) # In[98]: a = 'Dies ist eine Zeichenkette.' # Nun schauen wir, welche Buchstaben hierin vorkommen. zeichenvorrat = set(a) print(zeichenvorrat) # #### Named Tuples (nicht klausurrelevant) # # - Nicht Gegenstand dieser Vorlesung # - [Python Reference: Named Tuples](https://docs.python.org/3/library/collections.html#collections.namedtuple) # ### Benutzereingabe mit ```input()``` # In[58]: # Benutzereingabe mit input([text]) # Ergebnis ist Zeichenkette (s.u.) eingabe = input('Ihr Name? ') # ### Typumwandlung (Type Cast) # #### Zeichenkette in Ganzzahl (int) # In[100]: zahl_als_text = "7" zahl_als_int = int(zahl_als_text) # #### Zeichenkette als Gleitkommazahl (float) # In[101]: float_als_text = "3.1415" float_als_zahl = float(float_als_text) # #### Zahl als Zeichenkette (String) # In[102]: zahl_als_text = str(7) float_als_text = (str(3.1415)) # #### Umwandlung einer Zahl in eine Zeichenkette # In[121]: a = 42 a_string = str(a) # Was ist hier der Unterschied? print(a * 2) print(a_string * 2) # ## Übungsaufgaben # # Siehe separate Notebooks auf der [Seite zur Veranstaltung](http://www.ebusiness-unibw.org/wiki/Teaching/PIP). # ## Erweiterungen # Die folgenden Erweiterungen sind nicht Gegenstand der aktuellen Vorlesung und werden hier nur der Vollständigkeit halber genannt. # ### Type Checking in Python # # https://realpython.com/python-type-checking/ # ## Quellenangaben und weiterführende Literatur # \[Pyt2019\] Python Software Foundation. Python 3.8.0 Documentation. [https://docs.python.org/3/](https://docs.python.org/3/). # # Vielen Dank! # # [**http://www.ebusiness-unibw.org/wiki/Teaching/PIP**](http://www.ebusiness-unibw.org/wiki/Teaching/PIP)