Notebook

In [1]:

%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt

In [2]:

from tensorflow.keras.preprocessing import sequence
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Embedding
from tensorflow.keras.layers import LSTM
from tensorflow.keras.datasets import imdb

In [3]:

(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words=10000)

In [4]:

print(len(x_train), 'train sequences')
print(len(x_test), 'test sequences')

25000 train sequences
25000 test sequences

In [5]:

x_train[0]

Out[5]:

In [6]:

x_train = sequence.pad_sequences(x_train, maxlen=100)
x_test = sequence.pad_sequences(x_test, maxlen=100)

In [7]:

model = Sequential()

In [8]:

model.add(Embedding(10000, 128))

In [9]:

model.add(LSTM(128, dropout=0.2, recurrent_dropout=0.2))

In [10]:

model.add(Dense(1, activation='sigmoid'))

In [11]:

model.compile(loss='binary_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])

In [12]:

model.fit(x_train, y_train,
          batch_size=32,
          epochs=15,
          validation_data=(x_test, y_test))

Train on 25000 samples, validate on 25000 samples
Epoch 1/15
25000/25000 [==============================] - 57s 2ms/sample - loss: 0.4576 - accuracy: 0.7826 - val_loss: 0.3739 - val_accuracy: 0.8374
Epoch 2/15
25000/25000 [==============================] - 55s 2ms/sample - loss: 0.3278 - accuracy: 0.8650 - val_loss: 0.3807 - val_accuracy: 0.8314
Epoch 3/15
25000/25000 [==============================] - 55s 2ms/sample - loss: 0.2665 - accuracy: 0.8963 - val_loss: 0.3936 - val_accuracy: 0.8445
Epoch 4/15
25000/25000 [==============================] - 55s 2ms/sample - loss: 0.2157 - accuracy: 0.9151 - val_loss: 0.4046 - val_accuracy: 0.8408
Epoch 5/15
25000/25000 [==============================] - 54s 2ms/sample - loss: 0.1694 - accuracy: 0.9348 - val_loss: 0.4482 - val_accuracy: 0.8414
Epoch 6/15
25000/25000 [==============================] - 54s 2ms/sample - loss: 0.1372 - accuracy: 0.9491 - val_loss: 0.4898 - val_accuracy: 0.8319
Epoch 7/15
25000/25000 [==============================] - 54s 2ms/sample - loss: 0.1061 - accuracy: 0.9622 - val_loss: 0.5313 - val_accuracy: 0.8266
Epoch 8/15
25000/25000 [==============================] - 54s 2ms/sample - loss: 0.0843 - accuracy: 0.9708 - val_loss: 0.5785 - val_accuracy: 0.8304
Epoch 9/15
25000/25000 [==============================] - 54s 2ms/sample - loss: 0.0688 - accuracy: 0.9768 - val_loss: 0.6800 - val_accuracy: 0.8259
Epoch 10/15
25000/25000 [==============================] - 53s 2ms/sample - loss: 0.0643 - accuracy: 0.9780 - val_loss: 0.6923 - val_accuracy: 0.8189
Epoch 11/15
25000/25000 [==============================] - 53s 2ms/sample - loss: 0.0441 - accuracy: 0.9855 - val_loss: 0.8010 - val_accuracy: 0.8250
Epoch 12/15
25000/25000 [==============================] - 53s 2ms/sample - loss: 0.0340 - accuracy: 0.9893 - val_loss: 0.8034 - val_accuracy: 0.8284
Epoch 13/15
25000/25000 [==============================] - 53s 2ms/sample - loss: 0.0253 - accuracy: 0.9918 - val_loss: 0.9022 - val_accuracy: 0.8252
Epoch 15/15
25000/25000 [==============================] - 53s 2ms/sample - loss: 0.0195 - accuracy: 0.9938 - val_loss: 0.9009 - val_accuracy: 0.8240

Out[12]:

<tensorflow.python.keras.callbacks.History at 0x7f1e272b9cf8>

In [19]:

model_json = model.to_json()
open('imdb_model_architecture.json', 'w').write(model_json)
model.save_weights('imdb_model_weights.h5')