Stelle die Diagramme nach, die unten zu sehen sind. Dabei ist es nicht wichtig, dass deine Antworten ganz genau übereinstimmen. Es zählt, dass du durch dein Verständnis von ggplot2 zu einem ähnlichen Ergebnis kommst.
** Nutze für die ersten Diagrmme den mpg Datensatz. **
library(ggplot2)
library(ggthemes)
head(mpg)
manufacturer | model | displ | year | cyl | trans | drv | cty | hwy | fl | class |
---|---|---|---|---|---|---|---|---|---|---|
audi | a4 | 1.8 | 1999 | 4 | auto(l5) | f | 18 | 29 | p | compact |
audi | a4 | 1.8 | 1999 | 4 | manual(m5) | f | 21 | 29 | p | compact |
audi | a4 | 2.0 | 2008 | 4 | manual(m6) | f | 20 | 31 | p | compact |
audi | a4 | 2.0 | 2008 | 4 | auto(av) | f | 21 | 30 | p | compact |
audi | a4 | 2.8 | 1999 | 6 | auto(l5) | f | 16 | 26 | p | compact |
audi | a4 | 2.8 | 1999 | 6 | manual(m5) | f | 18 | 26 | p | compact |
Histogramm der hwy mpg Werte:
Balkendiagramm der Autos pro Hersteller mit Farbfüllung nach der Anzahl der Zylinder (cyl):
** Wechsle jetzt zum Datensatz "txhousing", der in ggplot2 eingebunden ist**
city | year | month | sales | volume | median | listings | inventory | date |
---|---|---|---|---|---|---|---|---|
Abilene | 2000 | 1 | 72 | 5380000 | 71400 | 701 | 6.3 | 2000.000 |
Abilene | 2000 | 2 | 98 | 6505000 | 58700 | 746 | 6.6 | 2000.083 |
Abilene | 2000 | 3 | 130 | 9285000 | 58100 | 784 | 6.8 | 2000.167 |
Abilene | 2000 | 4 | 98 | 9730000 | 68600 | 785 | 6.9 | 2000.250 |
Abilene | 2000 | 5 | 141 | 10590000 | 67300 | 794 | 6.8 | 2000.333 |
Abilene | 2000 | 6 | 156 | 13910000 | 66900 | 780 | 6.6 | 2000.417 |
** Erstelle ein Scatterplot von "volume" vs. "sales". Erhöhe anschließend die Lesbarkeit indem du mit Transparenz (alpha) und Frage (color) arbeitest. **
Warning message: “Removed 568 rows containing missing values (geom_point).”
** Füge eine "smooth fit" Linie zum Scatterplot von eben hinzu.** Hinweis: geom_smooth() kann dir weiterhelfen.*
`geom_smooth()` using method = 'gam' Warning message: “Removed 568 rows containing non-finite values (stat_smooth).”Warning message: “Removed 568 rows containing missing values (geom_point).”
Als nächstes werden wir ein Daten Visualisierungs Projekt bearbeiten, indem wir eine echte Visualisierung aus "The Economist" nachstellen!