Notebook

This notebook was prepared by Donne Martin. Source and license info is on GitHub.

Solution Notebook¶

Problem: Implement merge sort.¶

Constraints
Test Cases
Algorithm
Code
Unit Test

Constraints¶

Is a naive solution sufficient?
- Yes
Are duplicates allowed?
- Yes
Can we assume the input is valid?
- No
Can we assume this fits memory?
- Yes

Test Cases¶

None -> Exception
Empty input -> []
One element -> [element]
Two or more elements
Left and right subarrays of different lengths

Algorithm¶

Wikipedia's animation: alt text

Recursively split array into left and right halves
Merge split arrays
- Using two pointers, one for each half starting at index 0
  - Add the smaller element to the result array
  - Increment pointer where smaller element exists
- Copy remaining elements to the result array
- Return result array

Complexity:

Time: O(n log(n))
Space: O(n)

Misc:

Not in-place
Most implementations are stable

Merge sort can be a good choice for data sets that are too large to fit in memory, as large chunks of data can be read and written to disk.

Unlike many other sorting algorithms, merge sort is not done in-place.

See: Quicksort vs merge sort

Code¶

In [1]:

from __future__ import division


class MergeSort(object):

    def sort(self, data):
        if data is None:
            raise TypeError('data cannot be None')
        return self._sort(data)

    def _sort(self, data):
        if len(data) < 2:
            return data
        mid = len(data) // 2
        left = data[:mid]
        right = data[mid:]
        left = self._sort(left)
        right = self._sort(right)
        return self._merge(left, right)

    def _merge(self, left, right):
        l = 0
        r = 0
        result = []
        while l < len(left) and r < len(right):
            if left[l] < right[r]:
                result.append(left[l])
                l += 1
            else:
                result.append(right[r])
                r += 1
        # Copy remaining elements
        while l < len(left):
            result.append(left[l])
            l += 1
        while r < len(right):
            result.append(right[r])
            r += 1
        return result

Unit Test¶

In [2]:

%%writefile test_merge_sort.py
import unittest


class TestMergeSort(unittest.TestCase):

    def test_merge_sort(self):
        merge_sort = MergeSort()

        print('None input')
        self.assertRaises(TypeError, merge_sort.sort, None)

        print('Empty input')
        self.assertEqual(merge_sort.sort([]), [])

        print('One element')
        self.assertEqual(merge_sort.sort([5]), [5])

        print('Two or more elements')
        data = [5, 1, 7, 2, 6, -3, 5, 7, -1]
        self.assertEqual(merge_sort.sort(data), sorted(data))

        print('Success: test_merge_sort')


def main():
    test = TestMergeSort()
    test.test_merge_sort()


if __name__ == '__main__':
    main()

Overwriting test_merge_sort.py

In [3]:

%run -i test_merge_sort.py

None input
Empty input
One element
Two or more elements
Success: test_merge_sort