import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import warnings

warnings.filterwarnings('ignore')

# Load tidal data from NOAA
data = pd.read_csv('tides_san_francisco.csv')

# Convert date time strings to datetime objects
data['Date Time'] = pd.to_datetime(data['Date Time'])

# Extract date and time information
data['Date'] = data['Date Time'].dt.date
data['Time'] = data['Date Time'].dt.time

# Identify extreme tides (top and bottom 5%)
data['High Tides'] = (data['Prediction'] > data['Prediction'].quantile(0.99)).astype('int')
data['Low Tides'] = (data['Prediction'] < data['Prediction'].quantile(0.01)).astype('int')

# Find subsequent tide predictions
data['Post High'] = np.where(data['High Tides']==1, data['Prediction'].shift(-60), 0)
data['Post Low'] = np.where(data['Low Tides']==1, data['Prediction'].shift(-60), 0)
#data = data.dropna()

# Plotting the data
plt.figure(figsize=(12, 6))

# Plot extreme high tides
plt.subplot(1, 2, 1)
plt.hist(data[data['High Tides']==1]['Post High'], bins=30, edgecolor='black', alpha=0.7)
plt.axvline(data['Prediction'].mean(), color='red', linestyle='--', label='Mean Tide Level')
plt.title('Subsequent Tides After Extreme High Tides')
plt.xlabel('Tide (meters)')
plt.ylabel('Frequency')
plt.legend()

# Plot extreme low tides
plt.subplot(1, 2, 2)
plt.hist(data[data['Low Tides']==1]['Post Low'], bins=30, edgecolor='black', alpha=0.7)
plt.axvline(data['Prediction'].mean(), color='red', linestyle='--', label='Mean Tide Level')
plt.title('Subsequent Tides After Extreme Low Tides')
plt.xlabel('Tide (meters)')
plt.ylabel('Frequency')
plt.legend()

plt.tight_layout()
plt.show()


import yfinance as yf

# Fetch historical stock data
ticker = 'SPY'
data = yf.download(ticker, start='1990-01-01', end='2025-01-01', progress=False)
data['Daily Return'] = data['Adj Close'].pct_change() * 100

# Identify days with exceptionally high returns
high_return_days = data[data['Daily Return'] > data['Daily Return'].quantile(0.995)]
low_return_days = data[data['Daily Return'] < data['Daily Return'].quantile(0.005)]

# Calculate subsequent day returns
high_return_days['Next Day Return'] = data['Daily Return'].shift(-1).loc[high_return_days.index]
low_return_days['Next Day Return'] = data['Daily Return'].shift(-1).loc[low_return_days.index]

# Plotting the data
plt.figure(figsize=(12, 6))

# Plot extreme high tides
plt.subplot(1, 2, 1)
plt.hist(high_return_days['Next Day Return'], bins=30, edgecolor='black', alpha=0.7)
plt.axvline(data['Daily Return'].mean(), color='red', linestyle='--', label='Mean Daily Return')
plt.title('Distribution of Next Day Returns Following High Return Days')
plt.xlabel('Next Day Return (%)')
plt.ylabel('Frequency')
plt.legend()

# Plot extreme low tides
plt.subplot(1, 2, 2)
plt.hist(low_return_days['Next Day Return'], bins=30, edgecolor='black', alpha=0.7)
plt.axvline(data['Daily Return'].mean(), color='red', linestyle='--', label='Mean Daily Return')
plt.title('Distribution of Next Day Returns Following Low Return Days')
plt.xlabel('Next Day Return (%)')
plt.ylabel('Frequency')
plt.legend()

plt.tight_layout()
plt.show()


import math

# Download historical data for S&P 500 futures
start_date = '2000-01-01'
end_date = '2025-01-01'
df = yf.download('^GSPC', start=start_date, end=end_date, progress=False)

# Create signals DataFrame
signals = pd.DataFrame(index=df.index)
signals['Price'] = df['Adj Close']
signals['Return'] = signals['Price'].pct_change()
signals['Position'] = -signals['Return'].shift(1)
signals['Strategy_Return'] = signals['Position'] * signals['Return']
signals['Cumulative_Return'] = (1 + signals['Strategy_Return']).cumprod()

# Calculate performance metrics
first_valid_index = signals['Cumulative_Return'].first_valid_index()
last_valid_index = signals['Cumulative_Return'].index[-1]
total_days = (last_valid_index - first_valid_index).days

annReturn = (signals['Cumulative_Return'][-1] / signals['Cumulative_Return'].loc[first_valid_index]) ** (365 / total_days) - 1
annVol = math.sqrt(252) * signals['Cumulative_Return'].pct_change(1).std()
sharpeRatio = annReturn / annVol

# Plot cumulative returns
plt.figure(figsize=(8, 4))
plt.plot(np.log(signals['Cumulative_Return']))
plt.title('Next Day Reversion Strategy Performance', fontsize=14)
plt.xlabel('Date', fontsize=10)
plt.ylabel('Cumulative Return', fontsize=10)
plt.tight_layout()

# Annotate the plot with performance metrics
plt.text(0.01, 0.97, f"Annualized Return: {annReturn:.2%}\n"
                     f"Annualized Volatility: {annVol:.2%}\n"
                     f"Sharpe Ratio: {sharpeRatio:.2f}",
         transform=plt.gca().transAxes, fontsize=8, verticalalignment='top',
         bbox=dict(facecolor='white', alpha=0.8, edgecolor='gray'))

plt.show()


# Download price data
ticker = '^GSPC'
data = yf.download(ticker, start='2000-01-01', end='2025-01-01', progress=False)

# Compute the IBS indicator
data['IBS'] = (data['Close'] - data['Low']) / (data['High'] - data['Low'])

# Initialize columns for signals and positions
data['Signal'] = 0
data['Position'] = 0

# Generate buy signals
data.loc[data['IBS'] < 0.10, 'Signal'] = 1

# Generate sell signals (when to close the position)
data['Prev_High'] = data['High'].shift(1)
data.loc[data['Close'] > data['Prev_High'], 'Signal'] = -1

# Implement the logic to maintain the position until a sell signal is generated
in_position = False

for i in range(len(data)):
    if data['Signal'].iloc[i] == 1 and not in_position:
        data.loc[data.index[i], 'Position'] = 1
        in_position = True
    elif data['Signal'].iloc[i] == -1 and in_position:
        data.loc[data.index[i], 'Position'] = 0
        in_position = False
    elif in_position:
        data.loc[data.index[i], 'Position'] = 1

data['Position'] = data['Position'].ffill().fillna(0)

# Calculate the strategy returns
data['Strategy_Returns'] = data['Position'].shift(1) * data['Adj Close'].pct_change()
data['Cumulative_Strategy_Returns'] = (1 + data['Strategy_Returns']).cumprod()

# Calculate strategy performance metrics
trading_days = 252
annualized_return = (data['Cumulative_Strategy_Returns'][-1] / data['Cumulative_Strategy_Returns'].loc[data['Cumulative_Strategy_Returns'].first_valid_index()]) ** (365 / (data['Cumulative_Strategy_Returns'].index[-1] - data['Cumulative_Strategy_Returns'].first_valid_index()).days) - 1
annualized_volatility = data['Strategy_Returns'].std() * np.sqrt(trading_days)
sharpe_ratio = annualized_return / annualized_volatility

# Plot the cumulative returns
plt.figure(figsize=(8, 4))
plt.plot(np.log(data['Cumulative_Strategy_Returns']))
plt.title('IBS Indicator Strategy Performance', fontsize=14)
plt.xlabel('Date', fontsize=10)
plt.ylabel('Cumulative Returns', fontsize=10)
plt.tight_layout()

# Annotate the plot with performance metrics
textstr = '\n'.join((
    f"Strategy Annualized Return: {annualized_return:.2%}",
    f"Strategy Annualized Volatility: {annualized_volatility:.2%}",
    f"Strategy Sharpe Ratio: {sharpe_ratio:.2f}",
))

# Place a text box in upper left in axes coords
plt.gca().text(0.01, 0.97, textstr, transform=plt.gca().transAxes, fontsize=8,
               verticalalignment='top', bbox=dict(facecolor='white', alpha=0.8, edgecolor='gray'))
plt.show()


# Download historical data for oil majors
tickers = ['XOM', 'CVX', 'BP', 'SHEL', 'TTE']
price_data = yf.download(tickers, start='2000-01-01', end='2025-01-01', progress=False)['Adj Close']

# Calculate daily returns
daily_returns = price_data.pct_change().dropna()

# Construct the 2-day returns signal based on mean displacement
lookback_window = 2
signals = -(daily_returns.rolling(lookback_window).sum().subtract(
    daily_returns.rolling(lookback_window).sum().mean(axis=1), axis=0))

# Normalize the signal
signals = signals.divide(signals.abs().sum(axis=1), axis=0)
strategy_returns = signals.shift().multiply(daily_returns).sum(axis=1)
cum_returns = (1+strategy_returns).cumprod()

# Calculate performance metrics
ann_return = (cum_returns[-1] / cum_returns.loc[cum_returns.first_valid_index()]) ** (365 / (cum_returns.index[-1] - cum_returns.first_valid_index()).days) - 1
ann_vol = math.sqrt(252) * cum_returns.pct_change().std()
sharpe_ratio = ann_return / ann_vol

# Plot cumulative strategy returns
plt.figure(figsize=(8, 4))
plt.plot(np.log(cum_returns), label='Strategy Returns')
plt.title('Oil Majors Stat Arb Strategy Performance', fontsize=14)
plt.xlabel('Date', fontsize=10)
plt.ylabel('Cumulative Returns', fontsize=10)

# Annotate the plot with performance metrics
textstr = '\n'.join((
    f"Annualized Return: {ann_return:.2%}",
    f"Annualized Volatility: {ann_vol:.2%}",
    f"Sharpe Ratio: {sharpe_ratio:.2f}"
))

# Place a text box in upper left in axes coords
plt.gca().text(0.012, 0.97, textstr, transform=plt.gca().transAxes, fontsize=8,
               verticalalignment='top', bbox=dict(facecolor='white', alpha=0.8, edgecolor='gray'))
plt.tight_layout()
plt.show()


# Download historical data for S&P 500 futures
start_date = '1900-01-01'
end_date = '2025-01-01'
df = yf.download('^GSPC', start=start_date, end=end_date, progress=False)

# Create signals DataFrame
signals = pd.DataFrame(index=df.index)
signals['Price'] = df['Adj Close']
signals['Return'] = signals['Price'].pct_change()
signals['Position'] = -signals['Return'].shift(1)
signals['Strategy_Return'] = signals['Position'] * signals['Return']
signals['Cumulative_Return'] = (1 + signals['Strategy_Return']).cumprod()

# Calculate performance metrics
first_valid_index = signals['Cumulative_Return'].first_valid_index()
last_valid_index = signals['Cumulative_Return'].index[-1]
total_days = (last_valid_index - first_valid_index).days

annReturn = (signals['Cumulative_Return'][-1] / signals['Cumulative_Return'].loc[first_valid_index]) ** (365 / total_days) - 1
annVol = math.sqrt(252) * signals['Cumulative_Return'].pct_change(1).std()
sharpeRatio = annReturn / annVol

# Plot cumulative returns
plt.figure(figsize=(8, 4))
plt.plot(np.log(signals['Cumulative_Return']))
plt.title('Next Day Reversion Strategy Performance (1928-Present)', fontsize=14)
plt.xlabel('Date', fontsize=10)
plt.ylabel('Cumulative Return', fontsize=10)
plt.tight_layout()

# Annotate the plot with performance metrics
plt.text(0.01, 0.97, f"Annualized Return: {annReturn:.2%}\n"
                     f"Annualized Volatility: {annVol:.2%}\n"
                     f"Sharpe Ratio: {sharpeRatio:.2f}",
         transform=plt.gca().transAxes, fontsize=8, verticalalignment='top',
         bbox=dict(facecolor='white', alpha=0.8, edgecolor='gray'))

plt.show()


def rolling_autocorrelation(returns, window):
    return returns.rolling(window).apply(lambda x: x.autocorr(), raw=False)

daily_returns = df['Adj Close'].pct_change()
acf = rolling_autocorrelation(daily_returns, 500).dropna()
plt.figure(figsize=(8, 4))
plt.plot(acf)
plt.title('Rolling Autocorrelation of S&P 500 Returns', fontsize=14)
plt.xlabel('Date', fontsize=10)
plt.ylabel('Autocorrelation', fontsize=10)
plt.axhline(y=0, color='r', linestyle='--')
plt.tight_layout()
plt.show()


df = yf.download(['^GSPC'], '1940-01-01', '1990-01-01', progress=False)['Adj Close']
signals = (df.pct_change()>0).astype(int)
strategyReturns = signals.shift() * df.pct_change()
cumReturns = (1+strategyReturns).cumprod()
annReturn = cumReturns[-1] ** (365 / (cumReturns.index[-1]-cumReturns.index[0]).days) - 1
annVol = math.sqrt(252) * strategyReturns.std()
sharpeRatio = annReturn / annVol
plt.figure(figsize=(8, 4))
plt.plot(np.log(cumReturns))
plt.title('Next Day Momentum Strategy Performance (1940-1990)', fontsize=14)
plt.xlabel('Date', fontsize=10)
plt.ylabel('Cumulative Return', fontsize=10)
plt.text(0.01, 0.97, f"Annualized Return: {annReturn:.2%}\n"
                     f"Annualized Volatility: {annVol:.2%}\n"
                     f"Sharpe Ratio: {sharpeRatio:.2f}",
         transform=plt.gca().transAxes, fontsize=8, verticalalignment='top',
         bbox=dict(facecolor='white', alpha=0.8, edgecolor='gray'))
plt.tight_layout()
plt.show()

Ebb and Flow¶

Table of Contents¶

Regression to the Mean¶

Now Do the Opposite¶

It Takes Two to Tango¶

Market Mechanics¶

Addendum¶