ggplot2 Übung - Aufgaben¶

Stelle die Diagramme nach, die unten zu sehen sind. Dabei ist es nicht wichtig, dass deine Antworten ganz genau übereinstimmen. Es zählt, dass du durch dein Verständnis von ggplot2 zu einem ähnlichen Ergebnis kommst.

** Nutze für die ersten Diagrmme den mpg Datensatz. **

In [1]:

library(ggplot2)
library(ggthemes)
head(mpg)

manufacturer	model	displ	year	cyl	trans	drv	cty	hwy	fl	class
audi	a4	1.8	1999	4	auto(l5)	f	18	29	p	compact
audi	a4	1.8	1999	4	manual(m5)	f	21	29	p	compact
audi	a4	2.0	2008	4	manual(m6)	f	20	31	p	compact
audi	a4	2.0	2008	4	auto(av)	f	21	30	p	compact
audi	a4	2.8	1999	6	auto(l5)	f	16	26	p	compact
audi	a4	2.8	1999	6	manual(m5)	f	18	26	p	compact

Histogramm der hwy mpg Werte:

In [2]:

Balkendiagramm der Autos pro Hersteller mit Farbfüllung nach der Anzahl der Zylinder (cyl):

In [3]:

** Wechsle jetzt zum Datensatz "txhousing", der in ggplot2 eingebunden ist**

In [4]:

city	year	month	sales	volume	median	listings	inventory	date
Abilene	2000	1	72	5380000	71400	701	6.3	2000.000
Abilene	2000	2	98	6505000	58700	746	6.6	2000.083
Abilene	2000	3	130	9285000	58100	784	6.8	2000.167
Abilene	2000	4	98	9730000	68600	785	6.9	2000.250
Abilene	2000	5	141	10590000	67300	794	6.8	2000.333
Abilene	2000	6	156	13910000	66900	780	6.6	2000.417

** Erstelle ein Scatterplot von "volume" vs. "sales". Erhöhe anschließend die Lesbarkeit indem du mit Transparenz (alpha) und Frage (color) arbeitest. **

In [5]:

Warning message:
“Removed 568 rows containing missing values (geom_point).”

** Füge eine "smooth fit" Linie zum Scatterplot von eben hinzu.** Hinweis: geom_smooth() kann dir weiterhelfen.*

In [6]:

`geom_smooth()` using method = 'gam'
Warning message:
“Removed 568 rows containing non-finite values (stat_smooth).”Warning message:
“Removed 568 rows containing missing values (geom_point).”

Gut gemacht!¶

Als nächstes werden wir ein Daten Visualisierungs Projekt bearbeiten, indem wir eine echte Visualisierung aus "The Economist" nachstellen!